Original size 1750x2480

Обучение генеративной нейросети под стиль Джоанны Куинн

Джоанна Куинн (Joanna Quinn) — британская художница-аниматор, режиссёр и иллюстратор.

Её работы запоминаются своеобразным стилем, похожим на быстрые и экспрессивные карикатурные наброски.

Работы Джоанны Куинн

Идея проекта

Как студентка направления «Анимация», я часто обращаю внимание на художественное решение работ различных режиссеров. Работы Джоанны Куинн поразили меня с первого взгляда. Стиль этой художницы очень смелый и экспрессивный: небрежные линии контура, текстура карандаша. Джоанна создает выразительных персонажей иногда слегка преувеличивая их черты. Можно также заметить, что она не боится экспериментировать с ракурсами и формами. Характерной особенностью стиля также являются приглушенные и слегка растушеванные цвета.

Original size 2480x815

Кадры из мультфильма «Дела искусства», Джоанна Куинн, 2021

Мне стало интересно проанализировать основные особенности изобразительного стиля Джоанны Куинн и обучить им модель искусственного интеллекта, чтобы затем попробовать создать изображения в похожем стиле.

Так как сейчас в городе постепенно наступает весна, мне захотелось отразить её и в итоговой серии изображений. Таким образом, я постаралась показать в финальной версии картинок героиню, наслаждающуюся цветами и легкостью весенних дней.

Original size 1152x648

Работа Джоанны Куинн

Обучение модели

Для обучения модели я взяла 73 изображения Джоанны Куинн. Некоторые иллюстрации были взяты с её сайта, а некоторые изображения были кадрами из её анимационных работ.

Обучение генеративной модели было выполнено в Google Colab.

Работу я начала с загрузки всех необходимых библиотек и обучающего скрипта с GITHUB

Original size 3502x1814

фрагмент кода для проверки использования GPU

Original size 3502x2017

фрагмент кода

Следующим шагом было создание директории и загрузка датасета для обучения модели. С помощью функции image_grid, я проверила успешно ли отображаются загруженные изображения

Original size 3502x872

фрагмент кода

Original size 3502x1801

фрагмент кода

Далее нейросеть должна была проанализировать изображения из датасета и написать для них промпты, для дальнейшего обучения. (Генерация описаний сделана с помощью модели BLIP)

Original size 3502x1764

фрагмент кода

Original size 3502x1476

фрагмент кода, проверка подписей к изображениям

После этого был выполнен сам процесс обучения модели. Он занял у меня около двух часов

Original size 3502x1558

фрагмент кода

Перед обучением я ввела токен, созданный на Hugging Face для записи обучающей модели. И после окончания процесса тренировки, модель была сохранена на там.

Original size 3502x2170

фрагмент кода

Original size 3502x1638

фрагмент кода

Далее я приступила к процессу генерации изображений с помощью промптов

Original size 3502x490

пример кода с промптом

Процесс генерации изображений

Original size 2480x815