
Введение
Для написания кода пользовался Google Colab. Искал датасеты на kaggle.com. По тегу #games отсортировал все имеющиеся варианты и остановился на pokemon_bw.csv. В данном датасете представлен список всех покемонов в играх Pokémon Black Version и Pokémon White Version (версии одной и той же игры, которые слегка отличаются сюжетом, локациями и покемонами, доступными для ловли). Мне показалось забавным, что работать придется с данными о покемонах.
Типы диаграмм:
1. линейный график 2. круговая диаграмма 3. линейчатая диаграмма 4. точечная диаграмма
Выбрал типы диаграмм, наиболее наглядно визуализирующие данные.
Для генерации части кода пользовался данным чат-ботом:https://trychatgpt.ru
Этапы выполнения

Для начала научился импортировать файлы в коллаб. Чтобы это сделать, выбрал сессионное хранилище и загрузил из директории на ПК файл pokemon_bw.csv
Далее, импортировал Pandas — библиотеку Python для обработки и анализа структурированных данных:


Вывел данные датафрейма
Далее я выделил информацию о том, какие типы указаны в колонке Type, а также соответствующее каждому типу количество покемонов. Код был сгенерирован чат-ботом, после чего я внес некоторые корректировки, например, измнил разделитель на перенос строки вместо запятой:


Результат выполнения кода

Импортировал библиотеку для отображения графиков
По получившимся результатам построил график:
Самое большое количество покемонов оказалось типа Normal. Самыми же редкими оказались покемоны со смешанными типами bug, water; dragon, electric; grass, ground; dragon, fire; fire, rock
Покемонов некоторых типов оказалось всего по 2, и я решил проверить, не ошибся ли чат при генерации кода. Для этого я вычленил из общего пула соответствующие типы:
Оказалось, что это одни и те же покемоны, просто из разных версий. Кстати, «повторяющихся» покемонов в датасете оказалось довольно много
После я выделил 10 покемонов по сумме статов HP, Att, Def и Spd:
Сделал диаграмму, для визуального отображения результатов. Никак не мог сделать отображение значений из Total вместо процентов — пришлось опять прибегать к помощи чат-бота:
Посмотрел уровень HP топовых покемонов
…и Att
Посмотрел корелляцию этих статов. На этом моменте до меня дошло посмотреть в примерах, как убрать границы по краям графика:
На графике видно, что кроме двух исключений, HP и Att покемонов находятся в обратной зависимости, что хорошо влияет на баланс.
Заключение
Самым сильным, а в придачу и одним из самых доступных (его тип normal) для поимки оказался Slaking. Анализ графиков показывает, что статы этого покемона самые высокие в игре.
Если без шуток, то в ходе этого анализа я научился работать с датафреймами: выводить из них нужные данные, а также представлять эти данные в виде различных графиков.
Ссылка на датасет и код: ТЫК