Original size 1160x1600

Анализ данных о медалях в Олимпийских играх

PROTECT STATUS: not protected
5

Вводная часть

Я взял лист, содержащий данные о победах всех наций в Олимпийских играх с 1896 года по 2024 год. Его я нашел на сайте Kaggle, в разделе с дата-сетами, относящимися к спорту. Мне было интересно проанализировать именно такой список, так как я являюсь большим фанатом различных видов спорта, а также с помощью него можно понять, сколько нации за все время участия получили медалей всех степеней, от золотых до бронзовых. Я использовал линейные графики (для отображения динамики изменения количества медалей у лидирующих стран), столбчатые диаграммы (для сравнения количества медалей между странами в конкретный год), круговые диаграммы (для визуализации распределения медалей между странами в определенный год), гистограммы (для анализа распределения общего количества медалей по странам).

Этапы работы

Для начала я устанавливаю библиотеки Pandas, Matplotlib, Seaborn. Затем загружаю .csv c данными об медалях.

big
Original size 370x119

Так как я планирую сделать четыре разных графика, то для каждого я написал свой собственный код. Код для первого линейного графика, демонстрирующий динамику медалей между США, Россией и Китаем за последние 20 лет.

big
Original size 742x390

Затем я написал код для построения круговой диаграммы о распределении медалей в 2024 году по топ-10 странам.

Original size 742x136

Код для столбчатой диаграммы, сравнивающий количество медалей за 2020 и 2024 год стран, входящих в топ-10.

Original size 717x326

Код для гистограммы по общему количеству медалей стран за всю историю, отображающие только топ-10 стран.

Original size 738x202

Графики

Original size 876x548

По графику видно что США держатся в относительной стабильности по динамике общего количества медалей. Китай заработал наибольшее для себя количество в 2008 году, и постепенно приближается с каждой Олимпиадой к тому же числу. А вот Россия перестала участвовать в Олимпиадах после 2016 года, и выступала в нейтральном статусе.

Original size 715x663

Можно видеть что в Играх 2024 года основная доминация была за США, Китаем, Великобританией и Францией.

Original size 1006x608

Большая часть стран выступила в 2024 году лучше, чем в 2020. Япония, Италия, Нидерланды и Германия же наоборот, в 2020 году выступили лучше, чем в 2024.

Original size 858x611

США с огромным отрывом обгоняет другие страны в общем медальном зачете за всю историю Олимпийских игр. Большая часть стран по наибольшему количеству медалей за всю историю — из Европы. Две азиатские страны — Китай и Япония. И одна страна Океании — Австралия.

Описание применения генеративной модели

Для работы я использовал ИИ DeepSeek. Он помог с написанием кода.

Промпты: https://docs.google.com/document/d/1sxadyYJi7afmSgeJnyYgFLFAeBHSXT6Mh--8OPg9ktQ/edit?usp=sharing

Ссылка на модель: https://chat.deepseek.com

Для обложки использовался ИИ Leonadro.Ai (Phoenix 1.0)

Промпт: Olympic Games data analysis

Ссылка: https://app.leonardo.ai

Список источников

Aman Rajput. (2024). Olympics Medal List (1896-2024) [Data set]. Kaggle. https://www.kaggle.com/datasets/amanrajput16/olympics-medal-list-1896-2024?resource=download

Анализ данных о медалях в Олимпийских играх
5
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more