
Введение
Когда закончится сессия я определенно буду отдыхать. Я ещё не знаю что именно буду делать, но определённо в какой-то момент я почитаю мангу. И сейчас мне стало любопытно провести анализ, связанный с мангой.
Я подумал, чтоб было бы прикольно использовать цвета, которые так или иначе ассоциировались бы с мангой, поэтому подобрал такую небольшую палитру:

Также ради разнообразия (и интереса как поменять шрифт в программе), я решил взять шрифт Kurai Voice 2, потому что это один из базовых шрифтов для переводов манги, комиксов и т. п.

Диаграммы
Благодаря этому (и предыдущему) курсу, я неплохо сдружился с ChatGPT, и в результате нашего симбиоза получились следующие диаграммы: - Столбчатая диаграмма для подсчёта продаж манги; - Точечная диаграмма для корреляции между продажами и томами манг; - Круговая диаграмма для подсчёта аудитории; - Линейчатая диаграмма для выяснения кто масштабнее как издатель.
Взял такие базовые диаграммы, так как так проще показать результат.

Перед тем, как рисовать отдельные графики, я задаю шрифт и цвета, которые будут использоваться в дальнейшем.
Сначала мы строим столбчатую диаграмму, попутно настраивая заголовки и подписи осей. После добавляем подписи на столбцах и убираем лишние границы.
Здесь же сначала делаем диаграмму рассеяния, после настраиваем заголовки с подписями осей.
Тут делаем простую группировку с суммированием их продаж, а затем делаем круговую диаграмму.
Топ-10 издателей по количеству манга-серий
Первым делом мы здесь группируем данные по демографической аудитории, затем делаем горизонтальную диаграмму, настраиваем заголовки и подписи осей.
Итоговый код
Итого:
И в итоге получилось, что самые популярные манги выходят из-под крыла Shueshia, в основном их читают подростки\молодые люди. Что впрочем неудивительно. Но было интересно узнать как они выглядят на фоне «коллег».
Блокнот, Датасет, картинки в нормальном качестве: https://disk.yandex.ru/d/GmqwHETuzPkybg
Ссылка на kaggle: https://www.kaggle.com/code/adelanseur/manga-sales-eda-ml/input