
Концепция
Для анализа я выбрала датасет о продажах шоколада, который был найден на платформе Kaggle. Этот набор данных содержит подробные записи о продажах шоколада, включая информацию о продуктах, объемах продаж, доходах, а также сегментах клиентов.

Мне было интересно работать с этим датасетом, потому что он предоставляет возможность изучить динамику продаж, выявить ключевые факторы, влияющие на спрос, и понять, как различные стратегии могут повлиять на бизнес-результаты. Шоколад — это продукт, который пользуется стабильным спросом, но при этом его продажи могут зависеть от множества факторов, таких как сезонность, маркетинговые акции, ценообразование и предпочтения клиентов.
Для вдохновения я использовала ассоциации с шоколадом: его текстурой и цветами. Визуальная часть будет построена на теплых, насыщенных тонах, которые ассоциируются с какао, молочным и темным шоколадом.

Для визуализации данных я решила использовать несколько типов графиков, чтобы наиболее полно отразить различные аспекты анализа:
- Линейные график - Столбчатая диаграмма - Круговая диаграмма - Гистограмма
Обработка данных
Для начала я импортировала необходимые мне библиотеки: numpy, matplotlib.pyplot и pandas. После чего считала скачанный csv-файл датасета.
Далее я подготавливала данных для графика. Столбец с датами, преобразовала в формат datetime и создала дополнительные столбцы для группировки (по месяцам или годам), сгруппировала данные по регионам и временным периодам.
Сгруппировала данные по столбцу Product и просуммировала значения в столбце Boxes Shipped для столбчатой диаграммы.
Сгруппировала данные по странам и суммируем доход для круговой диаграммы.
Визуализация данных
График, который я построила, называется Stackplot (или Сложенный график).Он показывает динамику продаж шоколада по регионам и временным периодам.
На столбчатой диаграмме отображено количество проданных коробок для каждого продукта. Можно сравнить, какие продукты продаются лучше, а какие хуже.
На круговой диаграмме отображены продажи по продуктам
Гистограмма показывает распределение значений в столбце Boxes Shipped, количество единиц шоколада, проданных в рамках сделки.
Ссылка на блокнот с кодом и датасет https://disk.yandex.ru/d/Lg_4jGfx7HC7ew