
Описание
Изначально в моей голове возникло желание проанализировать социальные исследования, в данный момент для меня это самая интересная тема. Вбив на kaggle запрос «social studies» я нашла интересный вариант про социальные признаки и их связь с появлением рака. Я использовала круговые диаграммы, столбчатые, гистограммы и линейные. Для анализа я выбирала конкретные столбцы таблицы.
Этапы работы
Установка шрифта, цветов и его размера.

В таблице исследования я увидела графу количества беременностей и решила сделать круговую диаграмму для поиска связи. Я планирую ребенка в будущем и мне стало интересно повышает ли это риск развития рака.

Больше всего опрошенных имели одну и две беременности
Затем мне стало интересно стал интересен возраст опрошенных. Я слышала фразу: «Все умирают от рака, не все до него доживают», мне захотелось ее проверить.
Пик возраста приходиться на ранние 20ые годы жизни человека
Влияет ли курение на рак?
В этот раз я выбрала столбчатую диаграмму и взяла для диаграммы цвета ассоциации. Красный это «нет», а синий — «да».
В данном исследовании большинство пациентов не курят. Но надо помнить, что в других наблюдениях, например более масштабных, может быть другая корреляция и курение в любом случае вредно
Хоть это и не главный предмет исследования, но на основе данных можно провести анализ связи возраста, в котором был первый половой акт и количество половых партнеров за всю жизнь.
Небольшая связь этих двух метрик присутствует. Больше всего половых партнеров у людей, у которых первый сексуальный опыт был в 15 и 17.5 лет
Вывод
Таким образом в группе риска оказываются молодые люди с большим количеством половых партнеров и одной, двумя беременностями.
Блокнот и датасет: https://disk.yandex.ru/d/GBG0c4QTbQDhYg