Original size 1140x1600

Анализ статистики лесных пожаров

PROTECT STATUS: not protected

Концепция

В последние годы угроза лесных пожаров становится все более актуальной проблемой. Последний крупный инцидент, произошедший в январе этого года в Калифорнии, произвел на меня особое впечатление, поэтому, найдя датасет с данными о лесных пожарах конкретно в этом регионе, я сразу решила узнать больше именно о нем.

Сет содержит информацию о пожарах с 2014 по 2023 год, их местах, причинах и последствиях (включая и человеческие жертвы, и финансовый вред).

Внешний вид проекта основан в первую очередь на противопоставлении контрастных цветов и вдохновлен образом огня посреди ночного неба.

big
Original size 1185x670

Для визуализации я выбрала: гистограмму (чтобы нагляднее показать масштабы изменения тренда через соотношение величин), линейный график (чтобы точнее проследить этот тренд), круговую диаграмму (лучше всего подходящую для небольшого количества параметров) и точечную диаграмму (наоборот, хорошо визуализирующую большой массив данных).

Обработка данных

big
Original size 1700x425

После импорта нужных библиотек и считывания CSV-файла с датасетом я первым делом для удобства добавила отдельный столбец с годом происшествия. Изначально в сете содержалась только дата целиком, но т. к. я планировала собирать статистику по годам, нужно было выделить оттуда первые четыре символа.

После этого я сгруппировала все параметры в базе данных по году в отдельной переменной и для построения первого графика посчитала для каждого длину колонки с уникальным номером инцидента.

Original size 1807x292

При построении второго графика я посчитала количество вхождений каждой возможной причины в изначальном датасете.

Original size 1807x292

В третьем графике я подсчитала сумму колонки «Fatalities» для каждого года.

Original size 1807x172
Original size 1807x292

Четвертый график — простое сопоставление элементов двух колонок, а для построения пятого я снова группирую элементы, но по месту происшествия, после чего считаю сумму содержимого колонок.

Визуализация

Original size 2250x900

Первым шагом стал, естественно, подсчет динамики количества пожаров. В короткий промежуток, описанный в датасете, видимого его увеличения с течением времени не наблюдалось…

Original size 2250x900

…но вот количество смертей в последние годы заметно увеличилось.

Original size 2250x900

Самой распространенной причиной пожаров были действия людей, но количество случившихся из-за них инцидентов отличалось от количества произошедших по неизвестным причинам и из-за ударов молний лишь слегка. Других вариантов зарегистрировано не было.

Original size 2250x900

Поскольку в сете было много информации о последствиях пожаров для имущества, я также решила посмотреть на него и рассчитать, есть ли прямая зависимость между финансовым вредом и человеческими жертвами. При взгляде на последствия конкретных инцидентов четкого тренда не наблюдалось.

Original size 2250x900

После этого я рассмотрела те же данные, но на этот раз суммированные для отдельных областей. Здесь зависимость прослеживалась более явно и был заметен огромный разрыв в количествах так или иначе пострадавших в разных регионах.

Анализ статистики лесных пожаров
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more