
Анализ данных о депрессии у студентов
Описание
«Депрессия — это психическое расстройство, при котором длительная эмоциональная подавленность сопровождается нарушением соматических (двигательная активность, реакция на раздражение) и когнитивных (память, речь, концентрация внимания) функций.» Эта проблема существует и среди студентов. Она влияющая на их академическую успеваемость, эмоциональное состояние и качество жизни.
В этом проекте был проанализирован датасет с сайта (kaggle.com)о депрессии студентов. Он представляет собой широкий спектр информации, таких как пол, возраст, продолжительность сна, академическая успеваемость, наличие депрессии и другую информацию. Данный проект направлен на анализ данных и изучение факторов влияющих на ментальное здоровье студентов.
Виды графиков: - Круглая диаграмма (показывает общее процентное соотношение женщин и мужчин) - Гистограмма (показывает количество женщин и мужчин, здоровых и с депрессией) -Столбчатая диаграмма (показывает соотношение количества студентов с депрессией и продолжительности их сна) - Точечная диаграмма (Соотношение количества студентов с депрессией и их академическая успеваемость)
Этапы работ
Первым этапом для проведения анализа был импорт всех необходимых библиотек: -numpy -matplotlib.pyplot -pandas Следующий шаг- загрузка файла датасета в пространство Google Colab, затем считать его с помощью метода df=pd.read_csv ('/content/student_depression_dataset.csv')
Вторым этапом, после загрузки всех необходимых библиотек и данных, является работа с самими данными. Для удобства с помощью кода print (df.columns.tolist ()), , напечатала все столбцы из таблицы.
Круглая диаграмма
Для круглой диаграммы используя метод .value_counts (), я посчитала общее процентное соотношение мужчин и женщин из датасета.
Гистограмма
Для гистограммы я посчитала женщин и мужчин здоровых и с депрессией. Далее отрисовав саму диаграмму я приступила к ее стилизации. Добавила вспомогательные линии, код для цвета фона и шрифта.
Гистограмма показывает, что мужчин с депрессией больше, чем женщин. Однако число здоровых мужчин по сравнению с депрессующими гораздо больше.
Столбчатая диаграмма
Для столбчатой диаграммы я отфильтровала студентов с депрессией. Далее сгруппировала их по продолжительности сна с помощью метода df.groupby, и с помощью метода size () подсчитываю количество студентов.
Исходя из данной столбчатой диаграмма, можно сделать вывод что, наибольшее количество студентов с депрессией спят меньше 5 часов. Те студенты которые спят более 8 часов, наименьшее количество с депрессией. То есть студенты которые спят мало времени, больше подвержены депрессии.
Точечная диаграмма
Для точечной диаграммы отфильтровала только тех студентов, у которых присутствует депрессия. Далее они были посчитаны по их академической успеваемости.
Данная диаграмма показывает, что студенты, учащиеся на высоким баллам, подвержены большему уровню депрессии. В то время как те, кто учится на более низкие оценки, значительно меньшие подвержены депрессии.
Описание применения генеративной модели
-https://trychatgpt.ru/chat/67df0699f844e031486c5d03 В своем анализе я обращались с Chat GPT. Был полезен тем, что помог мне найти код для эффекта «выпячивания» в первом диаграмме. (Напиши мне метод для эффекта «выпячивания» в круглой диаграмме (pandas)) А также я обратилась к нему с вопросом, найти метод для установки темного фона в столбчатой диаграмме.
-https://deepai.org/machine-learning-model/text2img AI Image Generator (использован для обложки проекта)