
Идея проекта
Хаски известен нестандартными клипами, граничащими с работами современного искусства, и клип на песню «Сказки» — тому подтверждение. Это — мрачная, гротескная притча, исследующая тёмные грани русской культуры. Чёрно-белая палитра, искаженные образы, переосмысление сказок, религии и истории создают в клипе атмосферу русской мистики.
В рамках проекта я попросила искусственный интеллект написать небольшую легенду, на основе которой я сформировала 9 промтов для иллюстраций. Полученную историю я визуализировала с помощью модели Stable Difusion, дообученной на стиле клипа Хаски «Сказки».
Исходные изображения


Описание процесса генерации
Подготовка
Предобработка данных
Обучение LoRA-модели
Сохранение модели
После завершения обучения полученная LoRA-модель была загружена на платформу Hugging Face Hub для использования модели другими пользователями.
Результирующая серия изображений
Сначала я пробовала генерировать фотографии только на базе собранного датасета. Однако фото получались очень похожими на исходные кадры. Более того, если создавать нечеловеческие фигуры (какие-то объекты), модель выдает абстрактные разводы. Такой результат меня не устроил, поэтому я решила генерировать с использованием разного процента влияния исходных картинок.
Вся серия изображений
В целом, нейросети удалось считать стиль клипа Хаски «Сказки». Я думаю, получилось передать мрачную атмосферу русской сказки. Главные черты фотографий — черно-белая гамма, темнота, размытие, туман. Мне нравится, как в данном случае работают некоторые «баги» stable diffusion, они добавляют мистики, будто обитатели леса находятся под влиянием темного колдовства. Также, мне кажется, смотря на сгенерированные фотографии, можно примерно угадать сюжет легенды, к чему я и стремилась.
Мне не понравилось, что каждый раз получались разные эффекты размытия. Где-то зерно, в других случаях шум, свечение или расплывание, из-за этого фотографии выглядели немного разрозненно. Чтобы изображения были серийными, пришлось пробовать много раз и экспериментировать с процентом влияния датасета.
Также в разных вариантах отличалась контрастность, какие-то изображения получались приглушенными, в то время как другие почти не имели полутонов.
Применение генеративных моделей искуственного интеллекта
Помимо дообучения stable diffusion, я использовала ChatGPT для генерации легенды и описания процесса обучения нейросети.
Промт: Придумай короткую мистическую легенду о парне, который заблудился в лесу и встретился с его темными обитателями.
Промт 2: Напиши описание процесса обучения генеративной модели, опираясь на приложенные фотографии.
Ссылка: @gpt3_unlim_chatbot (имя телеграмм-бота)
Также я использовала телеграмм-бот для генерации обложки.
Промт: generate a glow of spirit --sref https://gochromic.hb.ru-msk.vkcs.cloud/1168765230/sref/c8c4fa9d91f7a3e332d2a5745d6ba63e.png
Ссылка: @chromic666_bot (имя телеграмм-бота)