
В этом проекте я анализирую заказы на доставку тако за 2024–2025 годы. Цель — понять, какие типы тако популярнее, как зависят чаевые от типа тако, как работает доставка в городах и какие дни для доставки лучше. Это поможет лучше понять поведение клиентов и улучшить процессы доставки и ценообразование, если вы вдруг хотите открывать свой тако-бизнес!
Этот датасет сразу привлек мое внимание, довольно интересные наблюдения можно из него выявить.
А еще я никогда не пробовала настоящий тако, но выглядит так вкусно!
Данные были взяты c kaggle.com
Загрузка и подготовка данных

Сначала мы скачали датасет с сайта Kaggle через библиотеку kagglehub.
import kagglehub
path = kagglehub.dataset_download («atharvasoundankar/taco-sales-dataset-20242025»)
Дальше мы загрузили данные в pandas — это удобная библиотека для анализа данных.
import pandas as pd
df = pd.read_csv («/kaggle/input/taco-sales-dataset-20242025/taco_sales_(2024-2025).csv»)
Очистка и создание признаков

Преобразовали даты в правильный формат
df['Order Time'] = pd.to_datetime (df['Order Time'], format='%d-%m-%Y %H: %M') df['Delivery Time'] = pd.to_datetime (df['Delivery Time'], format='%d-%m-%Y %H: %M')
Добавили новые колонки
df['Order Day'] = df['Order Time'].dt.day_name () # день недели df['Order Hour'] = df['Order Time'].dt.hour # час заказа df['Tip per KM'] = df['Tip ($)'] / df['Distance (km)'] # чаевые на 1 км df['Total ($)'] = df['Price ($)'] + df['Tip ($)'] # итоговая сумма
Стилизация визуализаций

Тут мы задаём стиль графиков и яркую палитру цветов, чтобы визуализации были эффектными.
import matplotlib.pyplot as plt import seaborn as sns
taco_palette_bright = ['FF3C38', 'FF8C42', '32FF6A', '#58D3F7']
plt.style.use ('dark_background') sns.set_context («notebook», font_scale=1.1)
plt.rcParams.update ({ 'axes.facecolor': '#1a1a1a', 'figure.facecolor': '#1a1a1a', 'axes.edgecolor': '#FFFFFF', 'axes.labelcolor': '#FFFFFF', 'xtick.color': '#FFFFFF', 'ytick.color': '#FFFFFF', 'text.color': '#FFFFFF', 'axes.prop_cycle': plt.cycler (color=taco_palette_bright), 'font.family': 'DejaVu Sans' })
Популярные типы тако

Строим график, что бы увидеть, какие типы тако заказывают чаще всего. Можно увидеть, какие вкусы популярнее, а какие — нет.
plt.figure (figsize=(10, 6)) sns.countplot (data=df, x='Taco Type', order=df['Taco Type'].value_counts ().index, palette=taco_palette_bright) plt.title ('Популярность разных типов тако') plt.xlabel ('Тип тако') plt.ylabel ('Количество заказов') plt.tight_layout () plt.show ()
Первое место занял куриный тако!
Среднее время доставки по городам

Строим столбчатую диаграмму, что бы посмотреть, в каких городах доставка занимает больше времени. Это важно для логистики: где стоит улучшить доставку.
city_delivery = df.groupby ('Location')['Delivery Duration (min)'].mean ().sort_values ()
plt.figure (figsize=(10, 6)) sns.barplot (x=city_delivery.values, y=city_delivery.index, palette=taco_palette_bright) plt.title ('Средняя продолжительность доставки по городам') plt.xlabel ('Время доставки (мин)') plt.ylabel ('Город') plt.tight_layout () plt.show ()
Доставка в будни и выходные

Решила сделать ящик с усами что бы было видно разницу доставки в будни и выходные дни.
plt.figure (figsize=(8, 6)) sns.boxplot (data=df, x='Weekend Order', y='Delivery Duration (min)', palette=[taco_palette_bright[0], taco_palette_bright[3]]) plt.title ('Сравнение доставки: будни и выходные') plt.xlabel ('Выходной заказ') plt.ylabel ('Время доставки (мин)') plt.xticks ([0, 1], ['Будни', 'Выходные']) plt.tight_layout () plt.show ()
Выходные показывают большее время доставки и разброс, что логично — больше заказов и загруженность курьеров.
Тепловая карта — цена vs топпинги и размер

Посмотрим, как цена меняется в зависимости от количества топпингов и размера тако.
heatmap_data = df.pivot_table (values='Price ($)', index='Toppings Count', columns='Taco Size', aggfunc='mean')
plt.figure (figsize=(8, 6)) sns.heatmap (heatmap_data, annot=True, fmt=».2f», cmap='YlOrRd', linewidths=0.5, linecolor='black') plt.title ('Средняя цена ($) в зависимости от топпингов и размера') plt.xlabel ('Размер тако') plt.ylabel ('Количество топпингов') plt.tight_layout () plt.show ()
Как показала нам тепловая карта, большие тако с 4+ топпингами — самые дорогие.
Средние чаевые по типу тако

Строим столбчатую диаграмму, что бы увидеть, есть ли зависимость чаевых от типа тако.
tips_by_type = df.groupby ('Taco Type')['Tip ($)'].mean ().sort_values (ascending=False)
plt.figure (figsize=(10, 6)) sns.barplot (x=tips_by_type.values, y=tips_by_type.index, palette=taco_palette_bright) plt.title ('Средние чаевые по типу тако') plt.xlabel ('Средние чаевые ($)') plt.ylabel ('Тип тако') plt.tight_layout () plt.show ()
Интересный вывод: некоторые типы тако приносят больше чаевых. Возможно, они дольше готовятся или просто больше нравятся клиентам.
Выводы
Самые популярные тако легко выделяются по количеству заказов — на них стоит делать упор в маркетинге, если вы хотите открывать свое тако-кафе.
В выходные доставка дольше — можно усиливать состав курьеров на субботу и воскресенье.
Город с самой быстрой доставкой можно использовать как пример для других.
Тепловая карта помогает гибко формировать цены: например, повышать их для больших и «богатых» тако.
Чаевые сильно варьируются по типу тако — важно учитывать это в мотивации поваров и курьеров.
Обложка была сгенерирована с помощью сервиса chatgpt.com