Original size 1140x1600

Полезные свойства меню McDonald’s

PROTECT STATUS: not protected
10

McDonald’s — это бренд, который знает каждый. Но задумывались ли вы, что скрывается за вкусом их бургеров, картошки фри и напитков? Меня давно интересовал вопрос: как устроено меню этой сети с точки зрения питательных характеристик? Что больше всего влияет на калорийность блюд? Какие категории самые лёгкие или, наоборот, сытные?

Именно поэтому я решил проанализировать данные о питательных характеристиках блюд McDonald’s. Этот анализ не только помогает лучше понять состав их меню, но и даёт возможность взглянуть на него с точки зрения цифр и фактов. Мне хотелось не просто «покопаться» в данных, но и визуализировать результаты так, чтобы это было понятно и увлекательно.

big
Original size 2624x1105

Для анализа я выбрал данные о питательных характеристиках блюд из меню McDonald’s, которые нашёл на платформе Kaggle. Почему именно они? Меню этой сети — одно из самых узнаваемых в мире, а его состав давно вызывает множество споров. Мне стало интересно: какие категории блюд наиболее калорийные? Какой у них баланс жиров, белков и углеводов?

С помощью Python и библиотек Pandas и Matplotlib я провёл исследование, чтобы не только ответить на эти вопросы, но и красиво визуализировать результаты.

Для наглядности я решил использовать несколько разных видов графиков:

Гистограмма — для оценки, сколько калорий содержат блюда и как они распределяются. Точечная диаграмма — чтобы показать связь между калориями и белками.

Линейный график — для отображения средней калорийности блюд в каждой категории.

Линейный график — чтобы увидеть, как категории отличаются по содержанию жиров.

Для оформления я подобрал фирменные цвета McDonald’s: яркий жёлтый, насыщенный красный и зелёный. Это придало графикам стиль, который легко ассоциируется с этим брендом.

big
Original size 1407x441

Обработка данных

Original size 2624x1105

После загрузки необходимых библиотек и файла я решил изучить его содержимое, чтобы понять, как устроены данные и что можно использовать в исследовании.

Original size 1407x537

Данные включают 24 столбца, среди которых такие важные параметры, как Item (название блюда), Category (категория), Calories (калорийность), Protein (белки), Total Fat (жиры) и другие. Кроме того, в таблице не оказалось пропущенных значений, что очень удобно.

Original size 2624x1105

Я решил удалить строки с некорректными значениями, например, блюда с нулевой калорийностью или слишком высокими значениями калорий, чтобы такие данные не мешали анализу.

Original size 1407x426

Данные стали чище и точнее, что позволило избежать искажений в итоговых выводах.

Чтобы исследовать меню более глубоко, я добавил новый столбец, который показывает, какой процент калорий блюда приходится на жиры.

Original size 1407x426

Почему это важно? Доля калорий из жиров помогает понять, насколько сбалансированы блюда и какие из них стоит отнести к «полезным» или «лёгким».

Original size 2624x1105

Для визуализации я рассчитал средние значения калорийности, жиров и белков по категориям блюд. Это позволило увидеть, как категории отличаются друг от друга по составу.

Original size 1407x426

Таблица со средними значениями калорий для каждой категории (Burgers, Salads, Desserts и др.). Эти данные использовались для создания графиков.

Визуализация данных

Original size 1366x765

На этом графике хорошо видно, что большинство блюд содержат от 200 до 600 калорий. Однако есть и «тяжеловесы» с калорийностью выше 1000. Это десерты и большие порции, которые вряд ли подойдут тем, кто считает каждую калорию.

Original size 1366x765

Точечная диаграмма: Корреляция между калориями и белками

Этот график демонстрирует интересную закономерность: чем больше калорий в блюде, тем больше в нём белков. Например, бургеры с большим количеством мяса не только калорийные, но и богаты белками, что делает их хорошим выбором для тех, кто хочет перекусить сытно.

Original size 1358x766

Линейный график: Средняя калорийность по категориям

Категории сильно отличаются по калорийности. Напитки и десерты — лидеры с точки зрения калорий, что неудивительно: сахар делает своё дело. А вот салаты и закуски, напротив, самые лёгкие по калорийности.

Original size 1159x766

Тут мы видим, что «Sandwiches» и «Beef & Pork» — самые жирные категории, благодаря соусам и мясным ингредиентам. В то же время салаты и напитки практически не содержат жиров.

Описание применения генеративной модели

Для своей работы я использовал GPT-4o mini. С помощью него я смог правильно подготовить датасет, исправить ошибки в коде и подобрать хорошую палитру олицетворяющий стиль Макдональдса.

Ссылка на GPT-4o mini: https://chatgpt.com/

Скачать блокнот с кодом и датасет

Ссылка на блокнот с кодом и датасет: https://drive.google.com/drive/folders/1PGOckHwircwcVqHEj28QG5naGeXVj59k?usp=sharing

Original size 2624x1105
Полезные свойства меню McDonald’s
10
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more