Исходный размер 905x1280

Анализ данных World Development Indicators

PROTECT STATUS: not protected

Для анализа я выбрал данные из открытого источника Всемирного банка, которые содержат информацию о макроэкономических показателях разных стран за последние несколько десятилетий. Датасет называется «World Development Indicators» и доступен для скачивания на официальном сайте Всемирного банка. В нем представлены такие показатели, как:

Внешний долг (External debt stocks, total (DOD, current US$))

Валовой национальный доход (GNI (current US$))

Золотовалютные резервы (Total reserves (includes gold, current US$)).

Эти данные представляют особую ценность, так как позволяют оценить экономическое развитие стран на протяжении длительного периода. Внешний долг, ВНД и резервы — ключевые индикаторы экономической стабильности и потенциала страны. Анализ этих показателей помогает понять, как страны справляются с экономическими кризисами, как меняется их благосостояние и насколько устойчивы их финансовые системы. Я выбрал для анализа четыре страны: Анголу, Бразилию, Китай и Индию. Эти страны представляют разные регионы и уровни экономического развития, что делает анализ более интересным и информативным.

Для визуализации данных я выбрал следующие типы графиков:

Линейные графики: для отображения динамики показателей (внешний долг, ВНД, резервы) по годам. Линейные графики идеально подходят для анализа трендов и изменений во времени.

Столбчатые диаграммы: для сравнения показателей между странами в конкретный год (2022). Этот тип графика позволяет наглядно сравнить значения по разным странам.

Этапы работы

  1. Обработка данных Работа с данными состояла из нескольких этапов:

Загрузка данных: Я использовал библиотеку pandas для загрузки CSV-файла. Данные содержали много лишних столбцов, поэтому я отфильтровал только те, которые относятся к годам и выбранным показателям.

post

import pandas as pd data = pd.read_csv ('API_20_DS2_en_csv_v2_13501.csv', skiprows=4)

Фильтрация данных: Я отобрал только те строки, которые относятся к выбранным показателям (внешний долг, ВНД, резервы) и странам (Ангола, Бразилия, Китай, Индия).

post

indicators = ['External debt stocks, total (DOD, current US$)', 'GNI (current US$)', 'Total reserves (includes gold, current US$)'] filtered_data = data[data['Indicator Name'].isin (indicators)] countries = ['Angola', 'Brazil', 'China', 'India'] selected_data = filtered_data[filtered_data['Country Name'].isin (countries)]

Преобразование данных: Данные были преобразованы из «широкого» формата (где каждый год — отдельный столбец) в «длинный» формат с помощью функции melt. Это позволило удобно строить графики.

post

pivot_data = selected_data.melt (id_vars=['Country Name', 'Indicator Name'], value_vars=year_columns, var_name='Year', value_name='Value')

Очистка данных: Я удалил строки с пропущенными значениями и преобразовал годы в числовой формат.

post

pivot_data = pivot_data.dropna () pivot_data['Year'] = pivot_data['Year'].astype (int)

Использование нейросетей

В процессе работы я использовал нейросеть ChatGPT, чтобы:

Оптимизировать код для построения графиков.

Получить рекомендации по стилизации графиков.

Написать пояснения к этапам работы.

Пример промпта: «Как сделать графики закрашенными и улучшить их читаемость?» Нейросеть предложила использовать plt.fill_between () для закрашивания областей под линиями и настроить прозрачность с помощью параметра alpha.

Стилизация графиков

Для стилизации графиков я использовал библиотеку Seaborn, которая предоставляет удобные инструменты для создания визуально приятных графиков. Я выбрал стиль darkgrid, так как он делает графики более контрастными и читаемыми. Вдохновением для стилизации послужили графики из научных статей и отчетов Всемирного банка, где используется минималистичный дизайн с акцентом на данные.

Исходный размер 855x556

Этот график показывает, как менялся внешний долг выбранных стран с течением времени. Видно, что у Китая и Индии долг растет быстрее, чем у Анголы и Бразилии.

Исходный размер 865x556

Здесь отображен рост валового национального дохода. Китай демонстрирует самый значительный рост, что свидетельствует о его экономическом буме.

Исходный размер 855x556

Этот график показывает изменение золотовалютных резервов. Китай и Индия значительно увеличили свои резервы за последние годы.

Исходный размер 865x556

Столбчатая диаграмма позволяет сравнить внешний долг, ВНД и резервы для каждой страны в 2022 году. Видно, что на момент 2022 года Китай лидирует по всем показателям.

Материалы:

Анализ данных World Development Indicators
Проект создан 23.03.2025
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше