Исходный размер 1140x1600

Количество предварительно расследованных преступлений

PROTECT STATUS: not protected

Предварительно расследовано преступлений, совершенных лицами, ранее совершавшими преступления

Водная часть

Для своего исследования я выбрала данные о количестве предварительно расследованных преступлений, совершённых ранее судимыми лицами, в различных регионах и субъектах Российской Федерации. Источник информации — открытый портал crimestat.ru, данные представлены в формате XML.

Анализ такой статистики имеет практическую значимость — он может способствовать выработке эффективных решений со стороны органов государственной власти и правоохранительных структур.

В рамках анализа я визуализирую данные с помощью круговых и линейных диаграмм, чтобы сделать информацию более наглядной и доступной для восприятия.

Процесс работы

Сравнение преступности в субъектах РФ и федеральных округах на основе предварительно расследованных преступлений, совершённых ранее судимыми лицами

Шаг 1: Загрузить .xml файл в Colab

big
Исходный размер 1398x140

Шаг 2: Прочитать XML-файл

big
Исходный размер 831x86

Шаг 3: Посмотреть всех потомков indicatorData

big
Исходный размер 853x92

Шаг 4: Посмотреть, что внутри одного подэлемента

big
Исходный размер 979x114

После этого нам становится ясно, как устроены данные, каждая запись выглядит следующим образом: < row > < value >… < / value > < report_period_begin >… < / report_period_begin > < region_name >… < / region_name > < report_period_end >… < / report_period_end > < / row >

Шаг 5: Преобразуем XML в pandas DataFrame

Исходный размер 1168x589

Шаг 6: Построим график

(1) Сравнение преступности в субъектах РФ и федеральных округах на основе предварительно расследованных преступлений, совершённых ранее судимыми лицами

Разделим все регионы на два типа:

  1. субъекты Российской Федерации (области, края, республики)

  2. федеральные округа (например, Приволжский ФО, Южный ФО и т. п.)

Затем сравним совокупное количество преступлений, совершённых ранее судимыми, в этих двух группах.

Шаг 1: Добавим столбец «Тип» (Субъект РФ или Федеральный округ)

Исходный размер 754x49

Шаг 2: Суммируем значения по типу региона

Исходный размер 833x189

Шаг 3: Рисуем диаграмму

Исходный размер 950x164
Исходный размер 650x527

(2) Топ-10 регионов с наибольшим ростом преступлений во втором полугодии

Сравним два периода:

  1. первое полугодие (например, до 01.07.2022)

  2. второе полугодие (например, до 01.12.2022)

И найдём регионы, где прирост был наибольшим.

Шаг 1: Загрузка и парсинг XML

Исходный размер 1315x341

Шаг 2. Оставим только два периода

Исходный размер 1086x120

Шаг 3. Преобразуем таблицу: строки — регионы, столбцы — периоды

Исходный размер 1090x104

Шаг 4. Отберём топ-10 регионов по приросту

Исходный размер 1117x246

Шаг 5. Построим столбчатую диаграмму

Исходный размер 1203x182
Исходный размер 1187x590

(3) Тепловая карта: Преступления ранее судимыми в топ-20 регионах РФ

Шаг 1: Загрузка и парсинг XML

Исходный размер 1369x355

Шаг 2: Создадим сводную таблицу

Исходный размер 1227x180

Шаг 3: Визуализируем — создадим тепловую карту

Исходный размер 1246x213
Исходный размер 1348x989

(4) Вариант графика: Линейная диаграмма динамики по федеральным округам

Покажем, как менялась динамика преступлений, совершённых ранее судимыми лицами, по федеральным округам за годы.

Шаг 1: Загрузка и парсинг XML

Исходный размер 1349x400

Шаг 2: Отфильтруем только федеральные округа

Исходный размер 815x56

Шаг 3: Сгруппируем по году и округу

Исходный размер 884x57

Шаг 4: Преобразуем в таблицу для графика

Исходный размер 931x53

Шаг 4: Построим линейный график

Исходный размер 1232x213
Исходный размер 802x469

(5) Диаграмма рассеяния: Преступность и её изменение по регионам

Покажем не только абсолютное число преступлений, но и насколько оно изменилось по сравнению с предыдущим периодом.

Шаг 1. Укажем путь к XML-файлу

Исходный размер 1229x38

Шаг 2. Распарсим XML-файл и собери таблицу

Исходный размер 1380x357

Шаг 3. Выделим данные за июль и декабрь 2022

Исходный размер 1156x70

Шаг 4. Объединим и рассчитаем изменения

Исходный размер 1251x54

Шаг 7. Построим scatter plot

Исходный размер 1361x257
Исходный размер 989x590
Количество предварительно расследованных преступлений
Проект создан 15.07.2025
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше