
Описание
Я учусь на геймдизайнера и решила поинтересоваться статистикой игр. Именно поэтому на сайте «Kaggle» я нашла датасет пользователей Steam. Я проанализировала данные игроков: список поведений пользователей со столбцами: идентификатор пользователя, название игры, название поведения, значение. Анализ этих данных поможет вычислить актуальные тренды и предпочтения игроков в индустрии.
В моей работе представлены: Ⅰ столбчатая диаграмма; Ⅱ круговая диаграмма; Ⅲ точечная диаграмма; Ⅳ линейная диаграмма.
Выбор пал на диаграммы, наиболее наглядно визуализирующие разницу между данными.
Стиль
При создании цветовой палитры я вдохновлялась оттенками игры «Марио». Именно эта игра олицетворяет игровую индустрию.

Цвета: #000000, #049CDB, #FBD000, #E52521, #43B047
В работе использован лаконичный и простой шрифт — AA Stetica, чтобы показать наглядность.

Ⅰ Топ 10 популярных игр по количеству часов
Ⅱ Распределение количества игр, купленных пользователями
Цифры от 1 до 100 указывают диапазоны количества покупок: «1-5»: пользователи, купившие от 1 до 5 игр. «6-10»: пользователи, купившие от 6 до 10 игр и т. д.
Ⅲ Соотношение покупок и времени, проведенного в игре
Ⅳ Распределение времени, проведенного в играх
Заключение
В процессе изучения датасета, содержащего информацию о пользователях и количестве часов, проведенного в каждой игре, я создала 4 диаграммы, наглядно иллюстрирующие тенденции в сфере геймдева.
Dota 2, CS: GO, Team fortress — лидеры по количеству наигранных часов среди пользователей. На площадке Steam зарегистрировано 73% пользователей, у которых от 1 до 5 приобретенных игр, в то время как количество пользователей, у которых приобретено больше чем 5 игр значительно меньше. Бестселлеры необязательно могут иметь большое количество наигранных часов среди пользователей. Больше 60 000 пользователей имеют не больше 100 наигранных часов на своем аккаунте.
Исходя из этой статистики можно сделать следующие выводы: Многопользовательские игры доминируют по количеству наигранных часов, это связано с их долгосрочной вовлечённостью и постоянным обновлением контента. Большинство пользователей Steam — «казуальные» игроки, большинство пользователей не активно инвестируют в покупку игр. Популярные игры с высокими продажами могут не иметь большого количества наигранных часов, так как они проходятся один раз. В то же время многопользовательские игры, даже с меньшими продажами, могут иметь больше часов благодаря своей долгосрочной вовлечённости. Значительная часть пользователей мало играет, многие пользователи Steam либо редко играют, либо используют аккаунт для покупок, а не для активного гейминга.
Описание применения генеративной модели
Для данной работы я использовала нейросеть Deepseek.
При каждом промпте я загружала датасет. При создании каждой диаграммы я использовала уникальный промпт:
Ⅰ Напиши код для столбчатой диаграммы на питоне: «Топ-10 самых популярных игр по количеству часов, проведенных в игре», на основе датасета, который я отправлю ниже. Сделай столбцы цвета #049CD8 и текст шрифтом «AA Stetica Medium.otf»
Ⅱ Напиши код для круговой диаграммы на питоне: «Распределение количества игр, купленных пользователями», на основе датасета, который я отправлю ниже. Используй цвета #049CDB, #FBD000, #E52521, #43B047 и текст шрифта «AA Stetica Medium.otf»
Ⅲ Напиши код для точечной диаграммы на питоне: «Распределение количества игр, купленных пользователями», на основе датасета, который я отправлю ниже. Используй цвета #049CDB, #FBD000, #E52521, #43B047 и текст шрифта «AA Stetica Medium.otf»
Ⅳ Напиши код для линейной диаграммы на питоне: «Распределение времени, проведенного в играх», на основе датасета, который я отправлю ниже. Используй цвета #049CDB, #FBD000, #E52521, #43B047 и текст шрифта «AA Stetica Medium.otf»