Original size 1140x1600

Анализ данных о погоде

PROTECT STATUS: not protected
4
big
Original size 1024x267

Для анализа я выбрала данные о погоде, так как это актуальная тема на каждый день и было интересно посмотреть изменения погодных условий в разный промежуток времени и на разных территориях. Данные были взяты из открытых источников и содержат информацию об исторических данных о погоде для нескольких городов за последние несколько лет: изменения температуры, осадки, влажность,

Мне было интересно узнать данные о погоде, потому что погода влияет на многие аспекты жизни, включая сельское хозяйство, транспортную систему, а также здоровье и состояние людей.

Кроме того, данные могут быть полезны для метеорологов и исследователей.

Для визуализации данных я использовала диаграммы и графики, которые хорошо показывают информацию:

Линейные графики: для отображения изменения температуры и осадков по времени.

Гистограммы: для визуализации распределения температуры и влажности.

Тепловая карта: для отображения корреляции между различными параметрами погоды.

ЦВЕТОВАЯ ПАЛИТРА

big
Original size 832x211

Для начала, чтобы создать визуализацию графиков мы настраиваем стиль, выбираем цветовую палитру. Я решила остановиться на оттенках голубого и синего, которые ассоциируются с небом, осадками и другими природными явлениями.

НАЧАЛО РАБОТЫ

Я импортировала библиотеку kagglehub, которая позволяет мне взаимодействовать с Kaggle API для загрузки датасетов. Затем я использовала функцию kagglehub.dataset_download (), чтобы загрузить датасет «weather-dataset» от пользователя «muthuj7». Это сохранило файлы датасета в моей локальной директории, и я записала путь к этим файлам в переменную path. Я импортировала библиотеку kagglehub, которая позволяет мне взаимодействовать с Kaggle API для загрузки датасетов. Далее, я использовала функцию files.upload () из библиотеки google.colab, чтобы загрузить файл weatherHistory.csv в мою текущую рабочую среду (Google Colab).

Original size 2150x748

Затем, я последовательно проверила, что файл weatherHistory.csv был успешно загружен, импортировала необходимые библиотеки, прочитала содержимое файла в формат pandas.DataFrame и вывела на печать начало этого датафрейма, чтобы ознакомиться с данными.

Original size 2150x856

После чего, я последовательно обработала данные, создала новые столбцы, рассчитала различные статистики и корреляции, чтобы подготовить данные для дальнейшего более глубокого анализа и понимания погодных условий.

Original size 2150x792

ВИЗУАЛИЗАЦИЯ ДАННЫХ

ГРАФИК № 1

ГРАФИК № 1 представляет собой линейный график, отображающий среднюю температуру по месяцам

Такая визуализация может быть полезна для понимания климатических особенностей региона и выявления аномальных температурных значений, которые могут представлять интерес для дальнейшего анализа.

Original size 836x545
Original size 1676x1384

ГРАФИК № 2

ГРАФИК № 2 представляет собой гистогамму, отображающий распределение температуры.

График позволяет визуально оценить распределение температур. Гистограмма показывает, как часто встречаются температуры в определенном диапазоне, а кривая плотности дает представление о форме распределения.

Original size 852x545
Original size 1302x280

ГРАФИК № 3

ГРАФИК № 3 представляет собой столбчатую диаграмму, отображающую информацию о количестве дне с осадками и их видом.Высота столбцов отображает, сколько дней в данном периоде наблюдались те или иные виды осадков.

Original size 704x546
Original size 1302x280

ГРАФИК № 4

ГРАФИК № 4 представляет собой стакированную столбчатую диаграмму, показывающую распределение осадков по месяцам и типам

Этот график позволяет визуально сравнить количество дней с различными типами осадков в каждом месяце. Высота столбцов отображает общее количество дней с осадками, а разбиение по цветам показывает, какие типы осадков преобладали в каждом месяце.

Original size 669x545
Original size 1826x376

ГРАФИК № 5

ГРАФИК № 5 представлен в формате тепловой карты, которая визуализирует корреляцию между тремя параметрами погоды: температурой, влажностью и давлением. Тепловая карта дает наглядное представление о силе и направлении связей между этими характеристиками.

Original size 621x525
Original size 1214x218

ГРАФИК № 6

ГРАФИК № 6 представлен в виде графика формата «ящик с усами», который позволяет визуально оценить распределение температур по месяцам. Мы можем увидеть, что температуры варьируются в зависимости от месяца, с более высокими значениями в летние месяцы и более низкими в зимние. Ящик с усами дает информацию о медиане, квартилях и выбросах, что помогает лучше понять характер распределения температур.

Такой график может быть полезен для понимания сезонных изменений температуры и выявления аномальных значений, которые могут представлять интерес для дальнейшего анализа.

Original size 844x545
Original size 1832x280

ГРАФИК № 7

ГРАФИК № 7 представлен в формате диаграммы рассеивания.

Этот график показывает взаимосвязь между температурой и влажностью в виде скоплений точек, Каждая точка на графике соответствует паре значений температуры и влажности, что позволяет визуально оценить, как эти два параметра погоды связаны друг с другом.

Диаграмма наглядно демонстрирует, как температура и влажность связаны друг с другом — мы можем увидеть, что с ростом температуры, как правило, снижается влажность.

Original size 839x545
Original size 1436x244

ЗАКЛЮЧЕНИЕ

ПРОВЕДЕННЫЙ АНАЛИЗ И ПОСТРОЕННЫЕ ГРАФИКИ ПОЗВОЛЯЮТ СДЕЛАТЬ СЛЕДУЮЩИЕ ВЫВОДЫ:

Из графика средней температуры по месяцам видно, что температура в регионе имеет ярко выраженную сезонность, с пиком в летние месяцы и минимумом в зимние.

График распределения температур показывает, что большая часть дней характеризуется умеренными температурами в диапазоне от 15°C до 25°C, с пиком около 20°C.

Распределение осадков демонстрирует, что регион в целом получает значительное количество осадков, причем как в виде дождя, так и в виде снега.

График распределения влажности указывает на преобладание влажных условий, с большей частью дней в диапазоне 50-90% влажности.

Корреляционная матрица показывает наличие сильной положительной связи между температурой и ветром, а также отрицательной связи между температурой и влажностью.

График зависимости температуры от влажности подтверждает эту отрицательную корреляцию, демонстрируя, что с ростом температуры, как правило, снижается влажность.

ДАТАСЕТ И КОД

Original size 1024x267
Анализ данных о погоде
4
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more