

Рубрикатор
1. Описание и актуальность проекта 2. Анализируемые категории данных 3. Загрузка и обработка данных — Соотношение количества фильмов и сериалов — Возрастные рейтинги Netflix — Средняя продолжительность фильмов по годам — Анализ просмотров фильмов и сериалов по месяцам — Доля контента, добавленного за последние 5 лет — Топ-10 жанров на Netflix — Распределение сериалов по количеству сезонов 4. Выводы 5. Блокнот и датасет

Описание и актуальность проекта
Netflix — это стриминговая платформа, которая собирает в одном месте множество различных фильмов, сериалов, телепередач и много другое. Netflix известен во всем мире и транслирует свои услуги на различную по возрасту, полу и национальности аудиторию. Из этого вытекает, что данная платформа, так или иначе, оказывает влияние на обширные категории людей, поскольку через фильмы и сериалы люди, во многом, строят свое отношение к ситуациям, формируют ценности и мнения.
Netflix сейчас задает тренды, часто становится примером для молодежи. Получается, что мировоззрение многих молодых людей отчасти зависит от этой платформы. Интересно понять, что по сути представляет из себя эта организация через контент, который она популяризирует, как внутри нее распределяются приоритеты по фильмам и сериалами. Для этого в проекте будут проанализированы базы данных по Netflix и выведена статиста и закономерные выводы.
Анализируемые категории данных
Среди всего обилия возможной информации о платформе, были выбраны следующие категории для анализа:
/1 Соотношение количества фильмов и сериалов /2 Возрастные рейтинги Netflix /3 Средняя продолжительность фильмов по годам /4 Анализ просмотров фильмов и сериалов по месяцам /5 Доля контента, добавленного за последние 5 лет /6 Топ-10 жанров на Netflix /7 Распределение сериалов по количеству сезонов
Были выбраны указанные выше категории данных, поскольку именно они отражают, какой конкретно контент больше всего привлекает потребителей, а также, в каком направлении в последние годы движется платформа, то есть ее вектор развития.
Загрузка и обработка данных
Сначала были импортированы все необходимые библиотеки для анализа данных, а также был установлен темный цвет фона для графиков, чтобы соответсnвовать основным цветам Netflix. Здесь же указываются все основные части анализа, которые в последствие будут переведены в графики и диаграммы.
/1 Соотношение количества фильмов и сериалов
В первую очередь, в коде рассчитывается сколько в data frame в колонне type фильмов, а сколько сериалов. Полученные данные визуализируются в график, который затем настраивается по тому, какие значения на какой оси и какая основная цветовая гамма. Как и все выполненные в проекте схемы, эта выполнена в фирменной цветовой гамме платформы.
Интересным становится то, что Netflix более известен своими сериалами, однако согласно статистике около 70% контента составляют фильмы.
/2 Возрастные рейтинги Netflix
Понимание того, какие возрастные рейтинги наиболее популярны, покажет какая основная аудитория, на которую работает платформа, а также к какому контенту более склонны потребители.
С помощью библиотеки Seaborn (sns) создается график, в котором по оси x выводятся виды рейтингов, а по оси y — их количество.
Описание возрастных рейтингов
Исходя из всех приведенных данных, можно сделать вывод, что наибольшая часть контента имеет возрастное ограничение TV-MA, что означает контент для взрослых (от 17 лет), который может содержать сцены различного характера, в том числе насилия и запрещенных веществ. Выбор подобных фильмов и сериалов большинством людей может заставить задуматься о негативных последствия контента подобного рода. Однако, второй и третий по популярности возрастные рейтинги TV-PG и ТV-14 говорят о том, что Netflix не пытается работать только на взрослую аудиторию, но привлекает и большое количество подростков.
/3 Средняя продолжительность фильмов по годам
Импортируем две библиотеки matplotlib.pyplot и seaborn Если в duration_numeric есть данные, код переходит к вычислению средней продолжительности фильмов для каждого года. В коде также распределяются данные, чтобы в график включались только строки, являющиеся фильмами (то есть исключая, например, ТВ-шоу). Затем полученные данные фильтруются по «Году выпуска» и с помощью [«duration_numeric»].mean () вычисляется средняя продолжительность фильмов для каждого года. Результат сохраняется в переменной duration_trend.
Основные выводы по данным: — Фильмы 1980-1990-х годов были длиннее (в среднем 120 минут). — Современные фильмы (2010-2020-е) короче (около 90-100 минут). — В последние годы наблюдается снижение продолжительности, особенно у фильмов для стриминговых платформ.
Здесь понятна тенденция идущая на снижение продолжительности, поскольку сейчас большинство контента в интернете — это короткие ролики, из-за чего способность удерживать внимание на чем-то одном долгое время падает. Это приводит к тому, что стриминг-платформы подстраиваются под зрителей, которые предпочитают динамичные сюжеты без лишних сцен.
/4 Анализ просмотров фильмов и сериалов по месяцам
Следующий приведенный график — линейный. Данные сгруппирован на месяц (month_added) и type (Movie или TV Show). Функция .size () подсчитывает количество добавленных названий для каждой комбинации месяца и типа. .unstack () изменяет структуру данных так, чтобы для фильмов и телешоу вывести два отдельных линейных тренда. Результат сохраняется в переменной monthly_views. Затем создается график сначала для фильмов, а потом для сериалов.
В итоге, просмотры сериалов достаточно равномерно распределены в течение года, однако среди фильмов можно заметить тенденцию к снижению просмотров в феврале и их максимальное увеличение в декабре. Декабрьский всплеск можно объяснить тем, что Netflix добавляет больше контента к сезону отпусков и новогодних праздников. А также значительный рост фильмов наблюдается в июне и июле, что, возможно, совпадает с выходом летних блокбастеров.
/5 Доля контента, добавленного за последние 5 лет
Сначала в коде рассчитывается, какой сейчас год, чтобы вывести данные только за последние пять лет. len (recent_content) подсчитывает количество названий, добавленных за последние 5 лет. len (df) подсчитывает общее количество названий в наборе данных. recent_share рассчитывает процентное соотношение названий, добавленных за последние 5 лет, к общему числу названий. Круговая диаграмма создается с помощью plt.pie.
Около 40-50% всего каталога Netflix было добавлено за последние 5 лет. Это говорит о высокой динамике пополнения контента. Netflix продолжает активно расширять библиотеку, особенно с учетом оригинального контента.
/6 Топ-10 жанров на Netflix
Среди самых популярных жанров много иностранных фильмов и сериалов (фильмы, в частности, на первом месте). Это показывает, что платформа многонациональна и многокультурна. Драмы располагаются на второй позиции по популярности. Вероятно, из-за того, что они очень разнообразны, а также часто отражают то, что происходит у людей в жизни.
/7 Распределение сериалов по количеству сезонов
Большинство сериалов на Netflix имеют только 1 сезон. Это связано с распространенной практикой мини-сериалов и экспериментальных проектов. Количество сериалов с 2 или 3 сезонами значительно меньше, что может свидетельствовать о досрочном закрытия некоторых шоу. Длинные сериалы (с 5+ сезонами) встречаются редко, что объясняется моделью производства контента Netflix, ориентированной на новые проекты.
Выводы
Исходя из всего вышесказанного можно сделать несколько выводов о стратегии Netflix?
Фильмы преобладают, но сериалы становятся важной частью контента. Netflix продолжает расширять производство сериалов, так как они удерживают подписчиков дольше.
Платформа ориентирована на подростков и взрослых зрителей. Высокая доля контента с рейтингами TV-MA и TV-14 подтверждает фокус на взрослую аудиторию. Просмотры фильмов зависят от сезонности, сериалы популярны круглый год. Пик просмотров приходится на декабрь, а летом интерес к фильмам снижается.
Современные фильмы стали короче. Это связано с трендом на более динамичный контент, который легче потреблять. Netflix активно добавляет новый контент, ведь около половины от общего числа фильмов и сериалов было добавлено за последние 5 лет. Это говорит о высокой скорости производства.
Получается, что Netflix успешно адаптируется к трендам индустрии, предлагая разнообразный контент, оптимизированный под потребности зрителей. Компания делает ставку на оригинальные сериалы, частое обновление каталога и сезонные премьеры.