
Вводная часть
UFC — один из самых динамичных и зрелищных видов спорта. Данные о боях позволяют проследить паттерны побед, доминирующие стили, и сравнить поведение бойцов по весу и возрасту. Кроме того, в этом проекте хотелось не просто визуализировать данные, а сделать это выразительно, визуально эффектно и точно.
Этот проект посвящён визуальному анализу боёв UFC за последние 5 лет. Мы изучаем, как бойцы побеждают, какие стили и категории доминируют, продолжительность боёв по раунду, самые популярные весовые категории и другое.
Сначала нужно загрузить и преобразовать открытые данные из объединённых таблиц UFC — merged_stats_n_scorecards.csv, содержащие информацию о более чем тысяче боёв: имена бойцов, исходы, раунды, веса, категории, методы побед и т. д.

Этот график поможет понять, как развивалась UFC-индустрия: были ли пики, спад, стабильный рост?
Количество боёв растёт — особенно за последние 3–5 лет, когда UFC стал мейнстримом. Отражается рост интереса зрителей, спонсоров и появление новых бойцов.
График Countplot идеален для подсчёта количества событий (боёв) по годам.
Гипотеза: Средний вес и лёгкий вес наиболее конкурентны и популярны — из-за скорости и зрелищности боёв.
Вывод: Наибольшее количество боёв происходит в средних и лёгких категориях — там больше бойцов, больше турниров.
Гипотеза: Бои заканчиваются в поздних раундах при равных силах, в ранних — когда есть явное доминирование.
Большинство боёв завершается в 3 раунде. Длинные — редкость.
График violinplot показывает плотность распределения — когда именно бой завершается.
Гипотеза: Чем дольше бой — тем больше вероятность, что он дойдёт до решения. Бойцы устают, снижается сила удара.
Что мы видим на графике: В первых двух раундах преобладают досрочные победы (особенно KO/TKO и Submission). В третьем раунде резко возрастает доля побед по решению судей — особенно Unanimous Decision. 4 и 5 раунды встречаются реже (меньше боёв, т. к. многие — не титульные), но тоже чаще заканчиваются решением, нежели досрочно. DQ (дисквалификация) — крайне редкий способ победы.
Вывод: Паттерн подтверждает гипотезу — по мере продвижения по раундам, растёт вероятность победы по решению судей, тогда как в начале боя чаще случаются нокауты и сабмишены. Это отражает естественную динамику боя: в начале — максимальная сила и скорость, к концу — усталость, осторожность и стратегическая выносливость.
Итог: В ранних раундах больше нокаутов, в поздних — решения судей.
Почему график stacked bar: Показывает структуру — долю каждого метода по раундам.
Гипотеза: Бойцы тяжёлого веса обладают большей силой, поэтому чаще заканчивают бой досрочно.
Почему countplot с hue: Чётко видно, какие методы чаще встречаются в каждой категории.
Вывод: В тяжёлых категориях чаще побеждают нокаутом, а в лёгких — решением судей.
Гипотеза: Победа не всегда зависит от количества ударов — важна точность, сила, контроль.
Почему scatterplot: Позволяет сравнивать оба значения одновременно + отметить победителя цветом.
Вывод: Часто побеждает тот, кто нанёс больше ударов вне зависимости от цвета (красный/синий), но есть исключения (например, сабмишен или нокаут при меньшем количестве ударов).
Пошаговая визуализация позволила глубже понять структуру боёв UFC:
История — популярность боёв растёт Категории — лёгкие и средние веса более конкурентны Динамика — много боёв заканчивается в 3 раунде Тактика — нокауты в начале, решения в конце Связь ударов и победы — есть, но не абсолютная Масса бойца влияет на метод завершения
Для повышения качества и выразительности проекта был использован искусственный интеллект, который помог:
создать уникальную визуальную обложку; структурировать и оформить ключевые идеи; улучшить и оптимизировать код (в том числе отдельные функции на Python).
Спасибо!