Исходный размер 2480x3500

Обучение генеративной нейросети под стиль мультфильмов Хаяо Миядзаки

Идея проекта

Визуальный стиль Хаяо Миядзаки отличается тщательной ручной прорисовкой с «дыханием» аналоговой анимации, где каждая линия и текстура ощутимо живые. Его работы наполнены детализированными, почти одушевлёнными пейзажами — шелестящей листвой, подвижными облаками и прозрачными потоками воды, создающими гипнотическую атмосферу. Архитектура часто отсылает к европейской культуре, но с японским чувством гармонии, а свет играет ключевую роль — тёплые тона уюта контрастируют с холодной тайной неизведанного. При этом даже в фантастических сюжетах природа остаётся главным героем: технологии визуально противопоставляются органике.

Стиль Хаяо Миядзаки отлично подходит для обучения генеративной нейросети и дает возможность своими руками создавать сказочный реализм, где волшебное кажется естественным, а земное — возвышенным.

Изображения для обучения

Исходный размер 3500x735
Исходный размер 3500x735
Исходный размер 3500x735
Исходный размер 3500x735
Исходный размер 3500x735
Исходный размер 3500x735

Процесс обучения

Генерация описания

Исходный размер 1243x789

Процесс генерации

Неудачные попытки

Исходный размер 1092x1069

Первые попытки сгенерировать изображения в стиле Хаяо Миядзаки оказались неудачными. Множество лишних деталей, руки растущие невесть откуда, поломанные пропорции. Стоит учесть, что использовались стандартные настройки, довольно простой промт и num_inference_steps=25

Исходный размер 1024x1024

Последующие попытки

Осознав, что базовые настройки и простые промты не дадут необходимого результата, я начала экспериментировать.

0

Как стало и как было

Исходный размер 1026x81

Для улучшения качества изображений я добавила негативный промт, guidance_scale=10 и увеличила количество шагов.

Получившиеся картинки стали на много чище, а персонажи сохраняли анатомию.

Исходный размер 1024x1024

Итог

В конечном итоге генерации стали значительно лучше, но негативный промт и количество шагов менялось в зависимости от промта, и сложности изображения.

Исходный размер 1024x1024
Исходный размер 1024x1024

Фоны

В работах Хаяо Миядзаки всегда выделялись красочные фоны, максимально проработанные и нарисованные чем-то похожим на акварель или гуаш. Мне было важно, чтобы генеративная нейросеть могла воспроизвести похожую детализацию и воздушную атмосферу.

Исходный размер 1024x1024
Исходный размер 1024x1024

Ссылка на код

Обучение генеративной нейросети под стиль мультфильмов Хаяо Миядзаки
Проект создан 10.04.2025
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше