Я выбрала набор данных о зимней пище и напитках, который доступен на платформе Kaggle. Этот датасет включает информацию о различных продуктах, таких как супы, напитки и закуски, их ценах, калориях, рейтингах и сезонных характеристиках.
Проанализировать зимнюю еду интересно, так как в это время выставляются баснословные ценники на каждую позицию, ещё осенью стоившую как все. Откуда идёт такое ценообразование? Мне стало интересно выявить зависимости между ценами, калориями и рейтингами, а также выявить тренды потребления пищи зимой. Это поможет получить ценные инсайты для меня в области питания, чтобы в будущих проектах знать, что зимой нравится покупателям больше. Такие сведения могут стать ценными и для маркетологов, и для производителей продуктов.
В процессе анализа использовались различные виды графиков для более детального изучения данных:
Гистограммы для анализа распределения цен и калорийности продуктов. Это позволяет оценить, в каких пределах находятся значения.
Ящики с усами для сравнения различных характеристик продуктов по категориям, например, по типам продуктов, чтобы увидеть распределение, медиану, выбросы.
Точечные диаграммы для исследования взаимосвязей между ценой, рейтингом и другими характеристиками.
Тепловая карта для изучения корреляций между числовыми характеристиками, такими как цена, калории, рейтинг и популярность. Тепловая карта позволяет легко увидеть сильные и слабые взаимосвязи между данными.
Линейный график (line plot) для визуализации зависимостей между двумя переменными, например, зависимость цены от рейтинга.

Сначала я загрузила датасет и посмотрела на его первые строки, чтобы понять, как он устроен. Затем проверила, нет ли пропущенных значений и дубликатов, чтобы убедиться, что данные чистые. После этого посмотрела общую статистику по числовым столбцам, чтобы понять, как распределяются данные.
Затем я проверила, все ли столбцы имеют правильные типы данных, чтобы избежать ошибок в дальнейшем анализе. И, наконец, убедилась, что в данных нет пустых значений. Если бы они были, я бы их удалила или заполнила нужными данными.
Этот процесс подготовки данных важен для того, чтобы они были чистыми и подходили для анализа и создания графиков.
Визуализация
Я выбрала максимально новогоднюю палитру цветов для вызова ассоциаций с этим праздником. Решила закрашивать только внутреннюю часть графика, чтобы получился оммаж на кружку, внутри которой находится напиток, или на мандарин, который лежит на белом столе.
График № 1
На графике видно распределение продуктов по категориям: супы, напитки и закуски. Напитков в датасете оказалось больше всего, за ними следуют закуски и супы. Это может говорить о том, что зимнее время включает больше продуктов для утоления жажды или согревающих напитков, чем для легких закусок или супов. Вывод: зимняя еда часто включает напитки как основной продукт для утоления жажды или создания тепла, что соответствует потребностям в холодное время года.
График № 2
После анализа распределения категорий продуктов, я решила исследовать цены на них. Видно, что большинство товаров сосредоточено в ценовых пределах от 6 до 10 долларов, что может свидетельствовать о наиболее популярных и доступных ценах для зимних продуктов. Также можно заметить, что в диапазоне выше 10 долларов количество продуктов резко снижается, что говорит о меньшей популярности более дорогих зимних продуктов.
График № 3
На этом графике изображена корреляция между четырьмя характеристиками зимних продуктов: ценой, калориями, рейтингом и популярностью.
Мы видим, что цена и калории имеют умеренную положительную корреляцию (0.26). Это может означать, что более калорийные продукты имеют тенденцию быть чуть дороже, хотя связь не слишком сильная. Однако, цена и рейтинг продуктов имеют отрицательную корреляцию (-0.35), что указывает на то, что более дорогие продукты не всегда имеют более высокие рейтинги. Напротив, цена и популярность практически не связаны, что говорит о том, что цена не сильно влияет на привлекательность продукта для потребителей.
Еще интересная деталь: калории и рейтинг также имеют слабую отрицательную корреляцию (-0.33), что может указывать на то, что продукты с большим количеством калорий не всегда имеют высокие рейтинги. Это может быть связано с предпочтениями потребителей, которые склонны отдавать предпочтение менее калорийным, но более вкусным продуктам.
Графики № 4-6
Далее я решила сравнить разные типы продуктов по некоторым факторам. Оказалось, например, что цена выше 10 долларов чаще отпугивает, а калорийность напитков и закусок схожа. Супы, как правило, менее калорийные по сравнению с другими типами продуктов. Странно, но цена на зимние продукты немного увеличивается в 2024 году по сравнению с 2023, а затем снова снижается в 2025. Это может указывать на сезонные колебания и изменение спроса в разные годы.
График № 7
График показывает зависимость калорийности продуктов от их цены. Из него видно, что связь между этими двумя переменными почти отсутствует: распределение калорий по ценам хаотичное, без четкой закономерности. Можно выделить несколько продуктов с высокой калорийностью, цена которых варьируется, но в целом, цена не влияет напрямую на количество калорий в продукте. Это может свидетельствовать о том, что выбор продуктов в зимний период зависит от разных факторов, а не только от цены или калорийности.
График № 8
Заметна общая тенденция: с каждым годом становится все больше качественных товаров, хотя они и увеличиваются в цене. График помогает понять, что, хотя более дорогие продукты (в диапазоне 10-15 долларов) могут иметь такие же высокие рейтинги, как и более дешевые (5-7 долларов), высокие цены не всегда связаны с высоким рейтингом. В частности, продукты из зим 2023 и 2025 годов имеют более широкий диапазон цен и рейтинг, что может указывать на различие в потребительских предпочтениях по сезонам.
График № 9
Этот график сочетает в себе гистограмму и кривую, что помогает проанализировать распределение цен по категориям продуктов (супы, напитки, закуски). Мы видим, что напитки преимущественно сосредоточены в ценовом диапазоне от 6 до 8 долларов, в то время как супы чаще встречаются в более низкой ценовой категории (от 2 до 6 долларов). Закуски занимают промежуточное положение, с ценами около 8 долларов.
То есть напитки имеют более широкое распределение цен по сравнению с супами, которые сосредоточены в меньшем диапазоне цен (на них мы состояние не делаем, значит). Кривая, отражающая общий тренд для всех продуктов, указывает на наибольшее количество продуктов в ценовом диапазоне от 8 до 12 долларов, что на самом деле не мало. Люди готовы платить за одну позицию в меню от 10 долларов, если она связана с сезоном и большим праздником.
График № 10
Этот график показывает, как цена зимних продуктов соотносится с двумя другими характеристиками: рейтингом и популярностью. Из графика видно, что рейтинг (зеленая линия) имеет тенденцию к стабилизации и небольшим колебаниям, не показывая явной зависимости от цены. Напротив, линия популярности (красная) значительно более изменчива, что может указывать на более прямое влияние цены на интерес к продуктам. При этом на более дорогих продуктах (от 10 долларов и выше) популярность снижается, несмотря на изменения рейтинга. Это может означать, что более дорогие продукты могут быть менее популярны среди покупателей, несмотря на высокие оценки.
Выводы, а точнее рекомендации для всех продавцов/маркетологов/дизайнеров этой ниши
Напитки пользуются большим спросом в зимний период, в то время как супы и закуски находятся на втором плане. Это подсказывает, что более разнообразные и универсальные товары, которые можно съесть или выпить на ходу, следует продвигать активнее в зимний сезон. Также важно учитывать, что цена продуктов обычно колеблется в пределах от 6 до 10 долларов, что делает их доступными для большинства потребителей. Однако, дорогие продукты не пользуются такой же популярностью, и поэтому маркетологам и производителям стоит подумать о стратегии ценообразования для повышения их привлекательности.
При этом калорийность продуктов не всегда зависит от их цены, что важно учитывать при позиционировании продуктов как здоровых или калорийных. Наблюдается определенная стабильность в ценах и категориях продуктов по сезонам, однако с каждым годом меняется предпочтение потребителей. Эти данные помогут выстроить более точные маркетинговые стратегии, оптимизировать ценовую политику и сделать акцент на тех продуктах, которые вносят наибольший вклад в прибыль, сохраняя баланс между ценой, калорийностью и популярностью.
Вкусной еды и хороших праздников! Не смотрите на калории и цены, главное атмосфера :)
А просмотреть коды и датасет →
Обложка была выполнена через Midjourney









