
Описание
Музыка — это неотъемлемая часть человеческой культуры, которая отражает настроения, тренды и ценности общества на протяжении десятилетий. В рамках данного проекта я провожу анализ датасета «The Top 5,000 Most Popular Albums» с сайта kaggle, Дата сет основан на информации с сайта Rate Your Music — одной из самых авторитетных платформ для оценки и обсуждения музыки. Этот датасет содержит информацию о 5 000 самых популярных альбомах по версии пользователей сайта, включая такие параметры, как год выпуска, жанры, продолжительность, рейтинг и другие характеристики.
Цель проекта — изучить, как менялись музыкальные предпочтения слушателей с течением времени, выявить самые популярные жанры и исполнители, а также понять, какие факторы влияют на успех альбома. Данный анализ позволит не только глубже понять эволюцию музыкальной индустрии, но и выявить интересные закономерности, которые могут быть полезны как для любителей музыки, так и для профессионалов индустрии.
При создании графиков были использованы следующая цветовая палитра, вдохновленная виниловыми пластинками и старыми обложками альбомов: #FF9F1C, #2EC4B6, #E71D36, #011627.
Для визуализации данных были использованы следующие графики:
Круговая диаграмма Столбчатая диаграмма Линейный график График рассеивания

График 1. Топ жанров.
В первом графике я решила проанализировать, какие топ-5 жанров самые встречающиеся среди 5000 лучших альбомов. Из датасета были взяты данные по каждому альбому и их основным жанрам — #primary_genres. Для визуализации данных я выбрала круговую диаграмму. С помощью value_counts () было подсчитано количество альбомов для каждого жанра.
На основе получившейся диаграммы мы можем увидеть, что топ-5 жанров занимает альтернативная музыка: рок и метал.

Круговая диаграмма топ-5 самых часто встречающихся жанров за все время.
Код для анализа датасета и создания диаграммы.
График 2. Сколько популярных альбомов вышло в каждом десятилетии.
Во втором графике я решила опять проанализировать популярность жанров, но в этот раз по десятилетиям и сколько было выпущено альбомов самого популярного в том-или ином десятилетии жанра. Для визуализации данных я выбрала столбчатую диаграмму.
С помощью кода я добавила столбцы с десятилетиями, например, 1983 -> 1980, 1995 -> 1990 и тд. Посчитала количество альбомов для каждого жанра в каждом десятилетии. И нашла самый популярный жанр в каждом десятилетии, с помощью groupby и idxmax ().
Столбчатая диаграмма самых популярных жанров по десятилетиям.
Код для анализа данных и создания столбчатой диаграммы.
График 3. Самые популярные альбомы по годам.
Для анализа трендов популярности по годам и построения третьего графика, показывающего, сколько альбомов из топ-5000 было выпущено в каждом году, я использовала библиотеки pandas для обработки данных и matplotlib или seaborn для визуализации. С помощью groupby и size () подсчитывается количество альбомов, выпущенных в каждом году.
Исходя из полученных данных, можно сделать вывод, что 1970-е является первым десятилетием, в котором было выпущено большое количество популярных в последствии альбомов. Это десятилетие пришлось на пик хард-рок групп (Black Sabbath, Led Zeppelin, Deep Purple, AC/DC). Следующий большой скачок произошел в 1990-х, этот период выдался на необычайную славу гранжа (Nirvana, Soundgarden, Radiohead). И еще один огромный скачок пришелся на вторую половину 2010-х. Это время многообразия жанров, а такое большое количество успешных альбомов можно также объяснить приходом стриминговых сервисов и независимых лейблов, талантливым исполнителям стало легче продвигать свою музыку. Упадок в 2020-х связан с тем, что датасет включает в себя информацию до 2021 года, поэтому информация по количеству альбомов выпущенных за этот период неполная.
Код для анализа и построения графика.
График 4. Самые высоко оцененные альбомы.
Для анализа альбомов, которые были оценены выше всего, и прослеживания исполнителей с самыми высокими рейтингами, мы я использовала данные из столбцов artist_name и avg_rating. Я сгруппировала данные по исполнителям, рассчитала средний рейтинг для каждого из них и простроила график рассеивания, чтобы визуализировать топ исполнителей по рейтингу.
Несмотря на то, что другие графики показывали преобладание таких жанров, как рок и метал, в топ-10 исполнителей вошли и другие жанры. Первое место занял Чарльз Мингус — американский джазовый контрабасист и композитор. Второе место заняла музыкальная хип-хоп группа Madvillian. Вы можете знать рэпера оттуда — MF Doom. Третье и четвертое место делят знаменитые рок группы. Пятое и шестое делят рэпер Гэри Эрл Грайс и Акира Ямаока, который написал саундтрэк для популярной серии игр Silent Hill. Седьмое место занял дуэт бразильских эстрадных исполнителей: Милтон Насименту и Ло Борджес. Восьмое заняла небезызвестная рок группы The Zombies. Девятое место занял великий гитарист Джимми Хендрикс, а десятое итальянский композитор Эннио Морриконе.
График рассеивания.
Код для анализа датасета и создания графика.
В рамках данного проекта был проведен анализ датасета «The Top 5,000 Most Popular Albums», который позволил изучить ключевые тренды и закономерности в мире музыки. Благодаря использованию современных методов анализа данных и визуализации, удалось ответить на ряд важных вопросов о популярности жанров, влиянии времени выпуска на успех альбомов, а также выявить самых успешных исполнителей и их работы.