Original size 1140x1600

Покупательское поведение: анализ и визуализация

PROTECT STATUS: not protected
4

Вводная часть

Для финального проекта я выбрала датасет Shopping Trends and Customer Behaviour с платформы Kaggle. Этот набор данных содержит информацию о покупках, совершённых разными группами клиентов: по полу, возрасту, категории товара, сезону и т. д.

Покупательское поведение — важный аспект при разработке цифровых сервисов и визуальных интерфейсов. Анализируя эти данные, можно глубже понять:

1. как возраст и устройство влияют на покупки;

2. какие категории товаров наиболее популярны;

3. как меняется поведение пользователей в зависимости от сезона.

Этапы работы

Для анализа данных использованы описательные методы и визуализация через pandas, matplotlib и seaborn. Построены 4 графика:

1. Круговая диаграмма Показывает долю категорий товаров в общих покупках. Помогает выявить самые популярные группы товаров.

2. Столбчатая диаграмма Отображает среднюю сумму покупки по способу оплаты и полу. Удобна для сравнения категорий по значению.

3. Гистограмма с кривой плотности Показывает распределение сумм покупок. Помогает понять, в каких ценовых диапазонах сосредоточено большинство клиентов.

График № 1

Сначала я загрузила и очистила датасет: удалил пустые строки и лишний индексный столбец. Затем привела типы данных к корректным числовым форматам. Для визуализаций использовала библиотеки matplotlib и seaborn, оформив всё в едином стиле: цветовая палитра Set2, светлая сетка, читаемые оси и подписи.

big
Original size 881x306

На первом этапе я построила круговую диаграмму, отражающую доли различных категорий товаров в общей массе покупок. Для этого я подсчитала количество покупок в каждой категории с помощью метода value_counts (). Круговая диаграмма хорошо подходит для отображения долей, и в данном случае она помогла визуально выделить самые популярные товарные группы — одежду, косметику и электронику.

0

График № 2

Второй этап — построение горизонтальной столбчатой диаграммы, показывающей среднюю сумму покупки в зависимости от способа оплаты. Я сгруппировала данные по полю Payment Method и вычислила средние значения.

0

Покупатели, использующие дебетовые и кредитные карты, тратят в среднем больше, чем те, кто оплачивает наличными или переводами. Это подчёркивает разницу в типе покупательской активности в зависимости от способа оплаты.

График № 3

Для анализа средней суммы покупки по полу я сгруппировала данные по столбцу Gender и рассчитала среднюю сумму покупок для каждой группы. Затем построили столбчатую диаграмму с помощью seaborn. barplot, применив общую цветовую палитру проекта.

0

Средний чек у женщин немного выше, чем у мужчин, но различия между группами не критичны. Это показывает сбалансированное поведение обеих групп покупателей с небольшим перевесом по сумме в сторону женщин.

График № 4

Финальный график — гистограмма с кривой плотности (KDE), отображающая распределение сумм покупок. Я использовала поле Purchase Amount (USD) и построила гистограмму с 20 интервалами.

0

Суммы покупок распределены достаточно равномерно по всему диапазону от 20 до 100 долларов, без резких скачков или провалов. Однако можно заметить, что немного чаще совершаются покупки на сумму около 30–40 $ и в районе 100 $ — эти значения выделяются как локальные пики. Это говорит о том, что покупатели склонны либо к умеренным расходам, либо к максимальному использованию бюджета.

Вывод

Анализ данных показал несколько устойчивых закономерностей в поведении покупателей. Наибольшее количество покупок совершается в категориях одежды, косметики и электроники, что говорит о высоком спросе на повседневные и потребительские товары. Средний чек выше у тех, кто использует банковские карты, по сравнению с наличными и переводами. Также установлено, что женщины в среднем тратят немного больше, чем мужчины. Распределение сумм покупок достаточно равномерное: большинство заказов попадает в диапазон от 20 до 100 долларов, с незначительными пиками на 30–40 $ и около 100 $. Эти данные позволяют обобщённо представить структуру расходов и типичного поведения покупателей в выборке.

Покупательское поведение: анализ и визуализация
4
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more