
Описание
Для анализа я выбрала датасет Video Game Sales, с данными о продажах видеоигр, содержащий информацию о названии игры, платформе, жанре, издателе, годе выпуска и продажах в разных регионах (Северная Америка, Европа, Япония, прочие), а также глобальные продажи. Этот датасет был взят с открытого источника Kaggle и представлен в табличном формате CSV. https://www.kaggle.com/datasets/gregorut/videogamesales
Меня заинтересовали эти данные, потому что видеоигры — это динамично развивающаяся индустрия с большим культурным и экономическим влиянием. Анализ продаж и их связи с жанрами, платформами и временем выпуска позволяет понять тенденции рынка, а также выявить, какие жанры и платформы наиболее успешны в разные периоды.
Также мне было интересно:
/Какие жанры наиболее прибыльны? /Как соотносятся продажи по регионам? /Какие платформы доминировали в разные годы?

Этапы
Для визуализации я выбрала несколько видов графиков:
Тепловая карта — чтобы увидеть корреляцию между продажами в разных регионах.
Линейный график с заливкой — для анализа глобальных продаж по годам.
Круговые диаграммы — сравнение жанров по платформам (PS4 и Xbox One).
Boxplot (ящик с усами) — чтобы показать распределение продаж по жанрам.
Точечный график с цветовой дифференциацией — тренды по годам с разбивкой по жанрам.
Обработка данных
Сначала я загрузила датасет с помощью библиотеки Pandas и проверила его структуру. Были удалены записи с отсутствующими значениями в ключевых столбцах, таких как год выпуска. Также я преобразовала типы данных для удобства анализа.
Визуализация и стилизация
Использован тёмный стиль оформления — он помогает фокусироваться на данных и делает цвета графиков более контрастными.
Палитра выбрана вручную — сочетание ярких, но не кислотных цветов (90E9DA — бирюзовый, FF003C — алый, 7F3782 — фиолетовый).
Вдохновение: стиль визуализаций из современных игровых дашбордов, например, в аналитике Steam или игровых отчётах компаний (Ubisoft, Sony).
Корреляция между регионами
Создана тепловая карта, чтобы понять, насколько похожи продажи в разных регионах.
Видно, что: NA и EU имеют наибольшую корреляцию (евро-американский рынок).
Японский рынок часто выделяется и имеет свои особенности.
Глобальные продажи по годам
Линейный график с заливкой позволяет легко увидеть пики продаж.
Пик приходится на конец 2000-х — период активного развития консолей PS3, Wii, Xbox 360.
После 2010-х наблюдается спад — переход к цифровым продажам, которые не учитываются в этом датасете.
Сравнение жанров по платформам
Круговые диаграммы: жанры на PS4 и Xbox One.
Позволяют увидеть, как отличается распределение предпочтений на разных платформах.
Например, Xbox больше ориентирована на Shooter, а PS4 — на Action и Adventure.
Распределение продаж по жанрам
Boxplot показывает:
Насколько сильно варьируются продажи в каждом жанре. Какие жанры имеют редкие, но очень высокие продажи (outliers) — например, Sports, Platform.
Зависимость продаж от года по жанрам
Scatter plot с логарифмической шкалой:
/Удобно отображает большой разброс данных. /Цветовая дифференциация по жанрам помогает увидеть: /Какие жанры были популярны в разное время. /Например, Platform был популярен в 80–90-е, а Action доминирует в 2010-х.
https://disk.yandex.ru/d/X4lvE6ln0PSDDA
ссылка на блокнот с кодом
Описание применения генеративной модели
В данном проекте использовалась нейросеть leonardo.ai для создания всех сопровождающих картинок.