
Вводная часть
Данные и источник:
Для анализа мы выбрали датасет о продажах видеоигр (Video Game Sales). Этот датасет взят с платформы Kaggle и содержит информацию об играх, их жанрах, годах релиза, издателях, платформах и глобальных продажах.
Почему эти данные интересны:
Индустрия видеоигр — одна из самых быстрорастущих и динамичных отраслей развлечений. Анализ таких данных позволяет понять эволюцию предпочтений игроков, взлёты и падения отдельных платформ и жанров, а также влияние издателей на рынок. Для нас это ценно, так как позволяет увидеть структурные тенденции и оценить, какие сегменты гейминга были наиболее успешными.
Выбор типов графиков:
Столбчатые диаграммы: Для сравнения категориальных данных (например, топ-жанры, топ-платформы). Линейный график: Для изучения динамики продаж по годам (помогает увидеть тренд во времени). Тепловая карта (Heatmap): Для визуализации распределения продаж в двумерном пространстве «Издатель-Жанр», чтобы выявить «горячие точки».
Этапы работы
1. Загрузка данных
Мы использовали библиотеку Pandas для чтения CSV-файла.

В главном скрипте (main.py) мы вызываем эту функцию.

2. Предобработка данных.
Проверили пропуски, удалили строки без года релиза или глобальных продаж, привели столбец с годом к целочисленному типу.
3. Анализ данных.
Мы выделили функции для анализа:
Получение топ-жанров по суммарным продажам. Суммарные продажи по годам релиза. Топ-платформы по продажам. Распределение продаж у топ-издателей по жанрам.
4. Визуализация и стилизация.
Использовали matplotlib и seaborn. Настроили стили (тема, палитра, шрифт) в plotting.py.
Строим графики




Стилизованные графики: Мы вдохновились геймерской эстетикой, выбрав палитру magma (создаёт ярко-контрастный вид) и тёмный фон сетки darkgrid, что напоминает неоновую инфографику. Отсутствие нейросетей — мы обошлись базовыми методами анализа.
Итоговые графики
Результаты сохраняются в папку output:
Top Genres by Global Sales (столбчатая): Показывает, какие жанры наиболее прибыльны. Global Sales by Year of Release (линейный график): Динамика продаж по годам, помогающая увидеть пики популярности. Top Platforms by Global Sales (столбчатая): Какие платформы доминировали на рынке? Sales Distribution by Publisher and Genre (тепловая карта): Взаимосвязь между ведущими издателями и их успешными жанрами.
Структура репозитория:
main.py — основной скрипт (вызов всей логики) data_loader.py, analysis.py, plotting.py, logger_utils.py — модули проекта vgsales.csv — датасет output/ — папка с готовыми графиками logs/ — лог-файлы работы программы