Исходный размер 1856x2464

Что мы едим на новогодних праздниках? Анализ зимней еды

PROTECT STATUS: not protected

Я выбрала набор данных о зимней пище и напитках, который доступен на платформе Kaggle. Этот датасет включает информацию о различных продуктах, таких как супы, напитки и закуски, их ценах, калориях, рейтингах и сезонных характеристиках.

Проанализировать зимнюю еду интересно, так как в это время выставляются баснословные ценники на каждую позицию, ещё осенью стоившую как все. Откуда идёт такое ценообразование? Мне стало интересно выявить зависимости между ценами, калориями и рейтингами, а также выявить тренды потребления пищи зимой. Это поможет получить ценные инсайты для меня в области питания, чтобы в будущих проектах знать, что зимой нравится покупателям больше. Такие сведения могут стать ценными и для маркетологов, и для производителей продуктов.

В процессе анализа использовались различные виды графиков для более детального изучения данных:

Гистограммы для анализа распределения цен и калорийности продуктов. Это позволяет оценить, в каких пределах находятся значения.

Ящики с усами для сравнения различных характеристик продуктов по категориям, например, по типам продуктов, чтобы увидеть распределение, медиану, выбросы.

Точечные диаграммы для исследования взаимосвязей между ценой, рейтингом и другими характеристиками.

Тепловая карта для изучения корреляций между числовыми характеристиками, такими как цена, калории, рейтинг и популярность. Тепловая карта позволяет легко увидеть сильные и слабые взаимосвязи между данными.

Линейный график (line plot) для визуализации зависимостей между двумя переменными, например, зависимость цены от рейтинга.

big
Исходный размер 1888x1008

Сначала я загрузила датасет и посмотрела на его первые строки, чтобы понять, как он устроен. Затем проверила, нет ли пропущенных значений и дубликатов, чтобы убедиться, что данные чистые. После этого посмотрела общую статистику по числовым столбцам, чтобы понять, как распределяются данные.

Затем я проверила, все ли столбцы имеют правильные типы данных, чтобы избежать ошибок в дальнейшем анализе. И, наконец, убедилась, что в данных нет пустых значений. Если бы они были, я бы их удалила или заполнила нужными данными.

Этот процесс подготовки данных важен для того, чтобы они были чистыми и подходили для анализа и создания графиков.

Исходный размер 1273x275

Визуализация

Я выбрала максимально новогоднюю палитру цветов для вызова ассоциаций с этим праздником. Решила закрашивать только внутреннюю часть графика, чтобы получился оммаж на кружку, внутри которой находится напиток, или на мандарин, который лежит на белом столе.

График № 1

Исходный размер 1536x706

На графике видно распределение продуктов по категориям: супы, напитки и закуски. Напитков в датасете оказалось больше всего, за ними следуют закуски и супы. Это может говорить о том, что зимнее время включает больше продуктов для утоления жажды или согревающих напитков, чем для легких закусок или супов. Вывод: зимняя еда часто включает напитки как основной продукт для утоления жажды или создания тепла, что соответствует потребностям в холодное время года.

Исходный размер 861x592

График № 2

Исходный размер 2024x668

После анализа распределения категорий продуктов, я решила исследовать цены на них. Видно, что большинство товаров сосредоточено в ценовых пределах от 6 до 10 долларов, что может свидетельствовать о наиболее популярных и доступных ценах для зимних продуктов. Также можно заметить, что в диапазоне выше 10 долларов количество продуктов резко снижается, что говорит о меньшей популярности более дорогих зимних продуктов.

Исходный размер 851x587

График № 3

Исходный размер 2094x582

На этом графике изображена корреляция между четырьмя характеристиками зимних продуктов: ценой, калориями, рейтингом и популярностью.

Мы видим, что цена и калории имеют умеренную положительную корреляцию (0.26). Это может означать, что более калорийные продукты имеют тенденцию быть чуть дороже, хотя связь не слишком сильная. Однако, цена и рейтинг продуктов имеют отрицательную корреляцию (-0.35), что указывает на то, что более дорогие продукты не всегда имеют более высокие рейтинги. Напротив, цена и популярность практически не связаны, что говорит о том, что цена не сильно влияет на привлекательность продукта для потребителей.

Еще интересная деталь: калории и рейтинг также имеют слабую отрицательную корреляцию (-0.33), что может указывать на то, что продукты с большим количеством калорий не всегда имеют высокие рейтинги. Это может быть связано с предпочтениями потребителей, которые склонны отдавать предпочтение менее калорийным, но более вкусным продуктам.

Исходный размер 774x553

Графики № 4-6

0

Далее я решила сравнить разные типы продуктов по некоторым факторам. Оказалось, например, что цена выше 10 долларов чаще отпугивает, а калорийность напитков и закусок схожа. Супы, как правило, менее калорийные по сравнению с другими типами продуктов. Странно, но цена на зимние продукты немного увеличивается в 2024 году по сравнению с 2023, а затем снова снижается в 2025. Это может указывать на сезонные колебания и изменение спроса в разные годы.

0

График № 7

Исходный размер 2062x550

График показывает зависимость калорийности продуктов от их цены. Из него видно, что связь между этими двумя переменными почти отсутствует: распределение калорий по ценам хаотичное, без четкой закономерности. Можно выделить несколько продуктов с высокой калорийностью, цена которых варьируется, но в целом, цена не влияет напрямую на количество калорий в продукте. Это может свидетельствовать о том, что выбор продуктов в зимний период зависит от разных факторов, а не только от цены или калорийности.

Исходный размер 867x592

График № 8

Исходный размер 2088x626

Заметна общая тенденция: с каждым годом становится все больше качественных товаров, хотя они и увеличиваются в цене. График помогает понять, что, хотя более дорогие продукты (в диапазоне 10-15 долларов) могут иметь такие же высокие рейтинги, как и более дешевые (5-7 долларов), высокие цены не всегда связаны с высоким рейтингом. В частности, продукты из зим 2023 и 2025 годов имеют более широкий диапазон цен и рейтинг, что может указывать на различие в потребительских предпочтениях по сезонам.

Исходный размер 1026x741

График № 9

Исходный размер 2242x554

Этот график сочетает в себе гистограмму и кривую, что помогает проанализировать распределение цен по категориям продуктов (супы, напитки, закуски). Мы видим, что напитки преимущественно сосредоточены в ценовом диапазоне от 6 до 8 долларов, в то время как супы чаще встречаются в более низкой ценовой категории (от 2 до 6 долларов). Закуски занимают промежуточное положение, с ценами около 8 долларов.

То есть напитки имеют более широкое распределение цен по сравнению с супами, которые сосредоточены в меньшем диапазоне цен (на них мы состояние не делаем, значит). Кривая, отражающая общий тренд для всех продуктов, указывает на наибольшее количество продуктов в ценовом диапазоне от 8 до 12 долларов, что на самом деле не мало. Люди готовы платить за одну позицию в меню от 10 долларов, если она связана с сезоном и большим праздником.

Исходный размер 1006x741

График № 10

Исходный размер 2038x672

Этот график показывает, как цена зимних продуктов соотносится с двумя другими характеристиками: рейтингом и популярностью. Из графика видно, что рейтинг (зеленая линия) имеет тенденцию к стабилизации и небольшим колебаниям, не показывая явной зависимости от цены. Напротив, линия популярности (красная) значительно более изменчива, что может указывать на более прямое влияние цены на интерес к продуктам. При этом на более дорогих продуктах (от 10 долларов и выше) популярность снижается, несмотря на изменения рейтинга. Это может означать, что более дорогие продукты могут быть менее популярны среди покупателей, несмотря на высокие оценки.

Исходный размер 1014x741

Выводы, а точнее рекомендации для всех продавцов/маркетологов/дизайнеров этой ниши

Напитки пользуются большим спросом в зимний период, в то время как супы и закуски находятся на втором плане. Это подсказывает, что более разнообразные и универсальные товары, которые можно съесть или выпить на ходу, следует продвигать активнее в зимний сезон. Также важно учитывать, что цена продуктов обычно колеблется в пределах от 6 до 10 долларов, что делает их доступными для большинства потребителей. Однако, дорогие продукты не пользуются такой же популярностью, и поэтому маркетологам и производителям стоит подумать о стратегии ценообразования для повышения их привлекательности.

При этом калорийность продуктов не всегда зависит от их цены, что важно учитывать при позиционировании продуктов как здоровых или калорийных. Наблюдается определенная стабильность в ценах и категориях продуктов по сезонам, однако с каждым годом меняется предпочтение потребителей. Эти данные помогут выстроить более точные маркетинговые стратегии, оптимизировать ценовую политику и сделать акцент на тех продуктах, которые вносят наибольший вклад в прибыль, сохраняя баланс между ценой, калорийностью и популярностью.

Вкусной еды и хороших праздников! Не смотрите на калории и цены, главное атмосфера :)

А просмотреть коды и датасет →

Обложка была выполнена через Midjourney

Что мы едим на новогодних праздниках? Анализ зимней еды
Проект создан 14.01.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше