Original size 1140x1600

Тако-аналитика

PROTECT STATUS: not protected
4

В этом проекте я анализирую заказы на доставку тако за 2024–2025 годы. Цель — понять, какие типы тако популярнее, как зависят чаевые от типа тако, как работает доставка в городах и какие дни для доставки лучше. Это поможет лучше понять поведение клиентов и улучшить процессы доставки и ценообразование, если вы вдруг хотите открывать свой тако-бизнес!

Этот датасет сразу привлек мое внимание, довольно интересные наблюдения можно из него выявить.

А еще я никогда не пробовала настоящий тако, но выглядит так вкусно!

Данные были взяты c kaggle.com

Загрузка и подготовка данных

post

Сначала мы скачали датасет с сайта Kaggle через библиотеку kagglehub.

import kagglehub

path = kagglehub.dataset_download («atharvasoundankar/taco-sales-dataset-20242025»)

Дальше мы загрузили данные в pandas — это удобная библиотека для анализа данных.

import pandas as pd

df = pd.read_csv («/kaggle/input/taco-sales-dataset-20242025/taco_sales_(2024-2025).csv»)

Очистка и создание признаков

post

Преобразовали даты в правильный формат

df['Order Time'] = pd.to_datetime (df['Order Time'], format='%d-%m-%Y %H: %M') df['Delivery Time'] = pd.to_datetime (df['Delivery Time'], format='%d-%m-%Y %H: %M')

Добавили новые колонки

df['Order Day'] = df['Order Time'].dt.day_name () # день недели df['Order Hour'] = df['Order Time'].dt.hour # час заказа df['Tip per KM'] = df['Tip ($)'] / df['Distance (km)'] # чаевые на 1 км df['Total ($)'] = df['Price ($)'] + df['Tip ($)'] # итоговая сумма

Стилизация визуализаций

post

Тут мы задаём стиль графиков и яркую палитру цветов, чтобы визуализации были эффектными.

import matplotlib.pyplot as plt import seaborn as sns

taco_palette_bright = ['FF3C38', 'FF8C42', '32FF6A', '#58D3F7']

plt.style.use ('dark_background') sns.set_context («notebook», font_scale=1.1)

plt.rcParams.update ({ 'axes.facecolor': '#1a1a1a', 'figure.facecolor': '#1a1a1a', 'axes.edgecolor': '#FFFFFF', 'axes.labelcolor': '#FFFFFF', 'xtick.color': '#FFFFFF', 'ytick.color': '#FFFFFF', 'text.color': '#FFFFFF', 'axes.prop_cycle': plt.cycler (color=taco_palette_bright), 'font.family': 'DejaVu Sans' })

Популярные типы тако

post

Строим график, что бы увидеть, какие типы тако заказывают чаще всего. Можно увидеть, какие вкусы популярнее, а какие — нет.

plt.figure (figsize=(10, 6)) sns.countplot (data=df, x='Taco Type', order=df['Taco Type'].value_counts ().index, palette=taco_palette_bright) plt.title ('Популярность разных типов тако') plt.xlabel ('Тип тако') plt.ylabel ('Количество заказов') plt.tight_layout () plt.show ()

Первое место занял куриный тако!

Original size 980x580

Среднее время доставки по городам

post

Строим столбчатую диаграмму, что бы посмотреть, в каких городах доставка занимает больше времени. Это важно для логистики: где стоит улучшить доставку.

city_delivery = df.groupby ('Location')['Delivery Duration (min)'].mean ().sort_values ()

plt.figure (figsize=(10, 6)) sns.barplot (x=city_delivery.values, y=city_delivery.index, palette=taco_palette_bright) plt.title ('Средняя продолжительность доставки по городам') plt.xlabel ('Время доставки (мин)') plt.ylabel ('Город') plt.tight_layout () plt.show ()

Original size 980x580

Доставка в будни и выходные

post

Решила сделать ящик с усами что бы было видно разницу доставки в будни и выходные дни.

plt.figure (figsize=(8, 6)) sns.boxplot (data=df, x='Weekend Order', y='Delivery Duration (min)', palette=[taco_palette_bright[0], taco_palette_bright[3]]) plt.title ('Сравнение доставки: будни и выходные') plt.xlabel ('Выходной заказ') plt.ylabel ('Время доставки (мин)') plt.xticks ([0, 1], ['Будни', 'Выходные']) plt.tight_layout () plt.show ()

Выходные показывают большее время доставки и разброс, что логично — больше заказов и загруженность курьеров.

Original size 780x580

Тепловая карта — цена vs топпинги и размер

post

Посмотрим, как цена меняется в зависимости от количества топпингов и размера тако.

heatmap_data = df.pivot_table (values='Price ($)', index='Toppings Count', columns='Taco Size', aggfunc='mean')

plt.figure (figsize=(8, 6)) sns.heatmap (heatmap_data, annot=True, fmt=».2f», cmap='YlOrRd', linewidths=0.5, linecolor='black') plt.title ('Средняя цена ($) в зависимости от топпингов и размера') plt.xlabel ('Размер тако') plt.ylabel ('Количество топпингов') plt.tight_layout () plt.show ()

Как показала нам тепловая карта, большие тако с 4+ топпингами — самые дорогие.

Original size 733x580

Средние чаевые по типу тако

post

Строим столбчатую диаграмму, что бы увидеть, есть ли зависимость чаевых от типа тако.

tips_by_type = df.groupby ('Taco Type')['Tip ($)'].mean ().sort_values (ascending=False)

plt.figure (figsize=(10, 6)) sns.barplot (x=tips_by_type.values, y=tips_by_type.index, palette=taco_palette_bright) plt.title ('Средние чаевые по типу тако') plt.xlabel ('Средние чаевые ($)') plt.ylabel ('Тип тако') plt.tight_layout () plt.show ()

Интересный вывод: некоторые типы тако приносят больше чаевых. Возможно, они дольше готовятся или просто больше нравятся клиентам.

Original size 980x580

Выводы

Самые популярные тако легко выделяются по количеству заказов — на них стоит делать упор в маркетинге, если вы хотите открывать свое тако-кафе.

В выходные доставка дольше — можно усиливать состав курьеров на субботу и воскресенье.

Город с самой быстрой доставкой можно использовать как пример для других.

Тепловая карта помогает гибко формировать цены: например, повышать их для больших и «богатых» тако.

Чаевые сильно варьируются по типу тако — важно учитывать это в мотивации поваров и курьеров.

Обложка была сгенерирована с помощью сервиса chatgpt.com

Тако-аналитика
4
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more