Original size 564x824

Самые продаваемые видеоигры

PROTECT STATUS: not protected
8

Вводная часть

Данные и источник:

Для анализа мы выбрали датасет о продажах видеоигр (Video Game Sales). Этот датасет взят с платформы Kaggle и содержит информацию об играх, их жанрах, годах релиза, издателях, платформах и глобальных продажах.

Почему эти данные интересны:

Индустрия видеоигр — одна из самых быстрорастущих и динамичных отраслей развлечений. Анализ таких данных позволяет понять эволюцию предпочтений игроков, взлёты и падения отдельных платформ и жанров, а также влияние издателей на рынок. Для нас это ценно, так как позволяет увидеть структурные тенденции и оценить, какие сегменты гейминга были наиболее успешными.

Выбор типов графиков:

Столбчатые диаграммы: Для сравнения категориальных данных (например, топ-жанры, топ-платформы). Линейный график: Для изучения динамики продаж по годам (помогает увидеть тренд во времени). Тепловая карта (Heatmap): Для визуализации распределения продаж в двумерном пространстве «Издатель-Жанр», чтобы выявить «горячие точки».

Этапы работы

1. Загрузка данных

Мы использовали библиотеку Pandas для чтения CSV-файла.

big
Original size 851x191

В главном скрипте (main.py) мы вызываем эту функцию.

big
Original size 405x82

2. Предобработка данных.

Проверили пропуски, удалили строки без года релиза или глобальных продаж, привели столбец с годом к целочисленному типу.

Original size 789x272

3. Анализ данных.

Мы выделили функции для анализа:

Получение топ-жанров по суммарным продажам. Суммарные продажи по годам релиза. Топ-платформы по продажам. Распределение продаж у топ-издателей по жанрам.

Original size 971x471

4. Визуализация и стилизация.

Использовали matplotlib и seaborn. Настроили стили (тема, палитра, шрифт) в plotting.py.

Original size 390x304

Строим графики

Стилизованные графики: Мы вдохновились геймерской эстетикой, выбрав палитру magma (создаёт ярко-контрастный вид) и тёмный фон сетки darkgrid, что напоминает неоновую инфографику. Отсутствие нейросетей — мы обошлись базовыми методами анализа.

Итоговые графики

Original size 1280x768
Original size 1280x768
Original size 1280x768
Original size 1280x768

Результаты сохраняются в папку output:

Top Genres by Global Sales (столбчатая): Показывает, какие жанры наиболее прибыльны. Global Sales by Year of Release (линейный график): Динамика продаж по годам, помогающая увидеть пики популярности. Top Platforms by Global Sales (столбчатая): Какие платформы доминировали на рынке? Sales Distribution by Publisher and Genre (тепловая карта): Взаимосвязь между ведущими издателями и их успешными жанрами.

Структура репозитория:

main.py — основной скрипт (вызов всей логики) data_loader.py, analysis.py, plotting.py, logger_utils.py — модули проекта vgsales.csv — датасет output/ — папка с готовыми графиками logs/ — лог-файлы работы программы

Самые продаваемые видеоигры
8
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more