
Концепция
В последние годы угроза лесных пожаров становится все более актуальной проблемой. Последний крупный инцидент, произошедший в январе этого года в Калифорнии, произвел на меня особое впечатление, поэтому, найдя датасет с данными о лесных пожарах конкретно в этом регионе, я сразу решила узнать больше именно о нем.
Сет содержит информацию о пожарах с 2014 по 2023 год, их местах, причинах и последствиях (включая и человеческие жертвы, и финансовый вред).
Внешний вид проекта основан в первую очередь на противопоставлении контрастных цветов и вдохновлен образом огня посреди ночного неба.

Для визуализации я выбрала: гистограмму (чтобы нагляднее показать масштабы изменения тренда через соотношение величин), линейный график (чтобы точнее проследить этот тренд), круговую диаграмму (лучше всего подходящую для небольшого количества параметров) и точечную диаграмму (наоборот, хорошо визуализирующую большой массив данных).
Обработка данных

После импорта нужных библиотек и считывания CSV-файла с датасетом я первым делом для удобства добавила отдельный столбец с годом происшествия. Изначально в сете содержалась только дата целиком, но т. к. я планировала собирать статистику по годам, нужно было выделить оттуда первые четыре символа.
После этого я сгруппировала все параметры в базе данных по году в отдельной переменной и для построения первого графика посчитала для каждого длину колонки с уникальным номером инцидента.
При построении второго графика я посчитала количество вхождений каждой возможной причины в изначальном датасете.
В третьем графике я подсчитала сумму колонки «Fatalities» для каждого года.
Четвертый график — простое сопоставление элементов двух колонок, а для построения пятого я снова группирую элементы, но по месту происшествия, после чего считаю сумму содержимого колонок.
Визуализация
Первым шагом стал, естественно, подсчет динамики количества пожаров. В короткий промежуток, описанный в датасете, видимого его увеличения с течением времени не наблюдалось…
…но вот количество смертей в последние годы заметно увеличилось.
Самой распространенной причиной пожаров были действия людей, но количество случившихся из-за них инцидентов отличалось от количества произошедших по неизвестным причинам и из-за ударов молний лишь слегка. Других вариантов зарегистрировано не было.
Поскольку в сете было много информации о последствиях пожаров для имущества, я также решила посмотреть на него и рассчитать, есть ли прямая зависимость между финансовым вредом и человеческими жертвами. При взгляде на последствия конкретных инцидентов четкого тренда не наблюдалось.
После этого я рассмотрела те же данные, но на этот раз суммированные для отдельных областей. Здесь зависимость прослеживалась более явно и был заметен огромный разрыв в количествах так или иначе пострадавших в разных регионах.