Original size 810x1079

Визуализация данных о косметике ✶

PROTECT STATUS: not protected
7

✧ выбор данных для анализа

Одной из важных составляющих моего гедонизма является страсть к косметике! Я ну очень люблю погружаться в эту тему и тестировать новинки в магазине; и вообще Золотое Яблоко — мой рай, так что мне стало интересно, какие взаимосвязи можно найти в данных о косметики. Поэтому, когда я нашла на сайте kaggle.com датасет «Лучшие косметические продукты по всему миру в 2024 году», то с радостью решила его проанализировать ♡

✧ moodboard и стиль оформления графиков

big
Original size 4096x2730

Индустрия косметики всегда ассоциируется с чем-то нежным, розовым, цветочным, поэтому была выбрана соответствующая цветовая гамма:

Основные цвета графиков — FBCAEF, 8A4C9F; фон — FEF4FB

Так же важны звёздочки. Какая косметика без блёсточек? Поэтому и графики я оформила блёстками

Текст решила написать антиквой, потому что косметика — это про изящность и утончённость. Выбор шрифта пал на неизменную классику — Times New Roman ♡

✧ визуализации

Сначала мне стало интересно, зависит ли тип кожи, для которого создаётся косметика от пола, для которой продукт производится? Я сделала тепловую карту

По ней видно, что мужчинам реже всего делают косметику для сухой кожи. Комбинированную косметику чаще делают в формате унисекс, что конечно же логично. А вот средства для чувствительной кожи унисекс делают реже ♡

0

Потом меня озадачил вопрос: влияет ли предполагаемая частота использования средства на его объём? Снова сделала тепловую карту.

Результаты интересные. Косметика, которая должна использоваться ежедневно, чаще всего бывает маленького объёма. С одной стороны кажется, что оно тогда должно заканчиваться быстрее и производители делают это специально. Но на самом деле так происходит скорее всего из-за того, что чаще всего это косметика по типу помады или туши.

Косметика, которую используют ситуативно чаще всего бывает 100 мл — это средний объём ♡

0

Проверила, влияет ли средняя цена на средний рейтинг каждого бренда. Для этого создала сложносочинённый график, где за цену отвечает столбчатый график, а за рейтинг — линейный.

Мы сразу можем увидеть, что самые высокие рейтинги у брендов Milk Makeup и RMS Beauty. При этом средняя цена у них не такая высокая по сравнению с другими брендами. Самые низкие рейтинги у трёх брендов в разной ценовой категории ♡

0

В таблице есть интересное значение Cruelty-free. Это маркировка продуктов, которые не испытывались на животных. Мне стало интересно, в какой части света чаще всего используют тесты на животных. Для этого я создала новую колонку в таблице — часть света, куда записала к какой части (Европа, Азия, Америка или Австралия) относится страна-производитель. Далее создала круговую диаграмму

Вывод: больше всего тестов косметики на животных производит Европа ♡

0

Решила посмотреть, насколько строги опрашиваемые этого датасета и сделала гистограмму частоты рейтинга ♡

0

Сделала облако из названий косметических средств ♡

0

Для работы над визуализацией данных в этом проекте я пользовалась DeepSeek для решения некоторых задач, например, для создания звёздочек

Ссылка на версию DeepSeek, которая использована: https://chat.deepseek.com/a/chat/s/89c7ee6a-9824-453e-a180-414981dfa8c7

также прикрепляю ссылку на диск — блокнот с кодом и датасет:

Визуализация данных о косметике ✶
7
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more