Original size 2480x3500

Обучение генеративной нейросети — PACE TAYLOR

PROTECT STATUS: not protected

Идея проекта

Когда я приступила к выбору художника для выполнения учебного задания, я обратила внимание на то, что нейросети уже давно используются для экспериментов в области искусства. Многие известные художники уже внедрены в алгоритмы, позволяющие воспроизводить их стиль. Желая реализовать более уникальный проект, я решила выбрать менее известного современного художника, Пейса Тейлора.

big
Original size 3750x1225

На втором году обучения по специальности дизайн одежды в рамках курса по арт-практике нам было задано изучить и воспроизвести стилистику определённого художника. Это задание предназначалось для расширения нашего арсенала техник стилизации. Выбор Пейса Тейлора был обусловлен его уникальным использованием цвета и материалов, особенно сочетанием мягкой текстуры пастели и остроты графитовых контуров.

big
Original size 5000x2475

Тейлор через свои работы исследует темы близости и интимности, что проявляется в тесном контакте персонажей и их эмоциональном взаимодействии.

big
Original size 5000x2475

В его технике можно выделить следующие особенности:

  • Мастерское использование мягкой пастели для создания нежных переходов и текстур, придающих произведениям легкость и воздушность.
  • Эмоциональная насыщенность, достигаемая за счет тщательной работы с цветом и оттенками на лицах и телах персонажей.
  • Яркость цветовой палитры с применением нестандартных, неорганических оттенков, таких как синий и красный, создающих визуально смелые и запоминающиеся образы.
  • Четкие графические контуры, сочетающиеся с размытыми участками, позволяющие управлять вниманием зрителя.
  • Динамика и движение, оживляющие каждое произведение за счет неожиданных композиционных решений и изогнутых линий.
Original size 1210x512

Иллюстрации автора к показу Maison Margela Spring 2020 Couture в стиле работ Пейса Тейлора.

В рамках задания мы сначала создавали копии его работ, а затем переносили его стиль на нашу собственную серию работ, изображая одежду из коллекций мировых брендов.

Original size 3750x1225
Original size 5000x2475

В моем проекте я использовала модель Stable Diffusion XL, чтобы поэкспериментировать со стилем Пейса Тейлора, исследуя, как нейросеть может воспринимать и трансформировать его манеру в новые произведения искусства, вдохновляясь, а не копируя его творчество.

Процесс обучения нейросети для генерации изображений

Подготовка данных и окружения На первом этапе происходит проверка аппаратного ускорения (GPU) и установка всех необходимых библиотек (bitsandbytes, transformers, accelerate, peft, diffusers, datasets). Создаётся локальная директория, куда пользователь загружает свои изображения. Затем, с помощью модуля PIL, формируется предварительный просмотр изображений, что помогает убедиться в корректности загруженного материала.

Аннотация и формирование метаданных Используется модель BLIP для автоматической генерации описаний (кадров) к каждому изображению. Полученные подписи дополняются префиксом «photo collage in pace taylor style», после чего формируется файл метаданных (metadata.jsonl). Этот этап обеспечивает синхронную связь между визуальным материалом и текстовыми описаниями, необходимыми для обучения.

Original size 3746x1720

Конфигурация обучения и запуск дообучения С помощью команды accelerate config происходит настройка обучающего окружения, а затем выполняется авторизация на Hugging Face Hub. После этого запускается скрипт train_dreambooth_lora_sdxl.py с детально прописанными параметрами: выбор предобученной модели Stable Diffusion XL, подключение соответствующего VAE, установка параметров обучения (например, размер батча, шаги градиентного накопления, скорость обучения и прочее) и применение техники LoRA для тонкой настройки модели под нужный стиль.

Сохранение результатов и публикация модели По завершении обучения веса модели (в формате LoRA) сохраняются в указанном выходном каталоге. Далее происходит автоматическая интеграция с Hugging Face Hub: создаётся репозиторий, генерируется карточка модели с описанием параметров обучения, и обученные файлы загружаются в репозиторий, что позволяет делиться результатами с сообществом.

Original size 3750x373

Инференс и визуализация итоговых изображений На завершающем этапе происходит загрузка обученной модели с применением LoRA-слоёв через DiffusionPipeline. В коде демонстрируется генерация изображения по заданному текстовому запросу (например, «photo collage in pace taylor style, man with hat»). Проводится тестирование работы модели с различными вариантами (с дополнительным слиянием LoRA), а результат визуализируется для оценки качества и стилистической точности обученной нейросети.

Original size 3750x1647

Серии изображений

Original size 3750x1860

Серия изображений с классическими сюжетами для Пейса Тейлора.

В рамках проекта я решила генерировать изображения двух различных категорий. Первая категория включает картины с сюжетами, которые, по моему мнению, отражают интересы и обычный спектр тем Пейса Тейлора, подчеркивая его стиль и предпочтения в искусстве. Вторая категория — это изображения с абсолютно отстраненными и несвойственными художнику сюжетами и объектами.

Цель эксперимента — проверить, как нейросеть применяет изученную стилистику для создания произведений искусства, которые выходят за рамки традиционных тем и предметов, тем самым исследуя границы адаптации и творческого восприятия модели.

Original size 3750x2809

Серия изображений с нестандартными сюжетами для Пейса Тейлора.

Серия 1

Original size 5000x2475

picture in pace taylor style, girl with long hair and boy, kissing / picture in pace taylor, portrait, beautiful woman, face, colorful

Original size 5000x2475

picture in pace taylor style, one man, portrait, cafe, blue background / picture in pace taylor style, man driving a car, view from inside

Original size 5000x2475

picture in pace taylor style, an artist at work in their studio / a portrait in pace taylor styles howcasing a profile

Original size 5000x2475

picture in pace taylor, close up portrait man looking at himself in a mirror in a bathroom / picture in pace taylor, man gazing into a mirror framed by pale blue tiles, reflecting

Серия 2

Original size 5000x2475

picture in pace taylor style, joker, red background / picture in pace taylor, a close-up portrait of a fluffy kitten

Original size 5000x2475

picture in pace taylor, Matryoshka on the table / picture in pace taylor, sport male, playing sokker

Original size 5000x2475

picture in pace taylor style, woman in red dress, dancing / a close up portrait n pace taylor style, woman engrossed in a book, seated on a plush sofa

Даже при значительном отходе от оригинального контекста стиль Пейса Тейлора сохраняет свою узнаваемость. Это проявляется в нескольких ключевых элементах:

  • Графический контур: чёткие, но мягкие очертания фигур и объектов, придающие композиции структурированность и цельность.
  • Пастельная текстура: характерная фактура мазков, создающая ощущение мягкости и ручной работы.
  • Спектр цветов: фирменное сочетание розово-бежевых, сиреневых, голубых и золотистых оттенков, формирующее узнаваемую атмосферу работ.
Original size 3750x1225

picture in pace taylor style, landscape new york city, view from above / a breathtaking urban sunset with the sky painted in hues of orange / a charming lady with a small dog walking down the street

Original size 3750x1225

picture in pace taylor style, jazz concert scene with musicians on stage / a steaming cup of coffee on a small table by a large window / a close up sketch of breakfast on a plate — eggs and vegetables

Вывод

В ходе проекта удалось успешно генерировать изображения, соответствующие стилистике Пейса Тейлора, подтверждая эффективность использования нейросети Stable Diffusion XL для имитации художественных стилей.

Особенно удачными оказались работы, где тематика совпадала с привычными мотивами художника. Эксперименты с абсолютно отстраненными темами показали, что нейросеть способна сохранять основные характеристики стиля Тейлора, такие как графический контур, мягкую пастель и спектр цветов. Однако такие произведения стоит рассматривать обособленно от автора, что открывает возможности для создания чего-то совершенно нового и расширения границ современного искусства.

Применение генеративной модели

  • Для генерации промтов был использован ChatGPT.
  • Для решения проблем с кодом применялся инструмент Gemeni 2.5 Pro.
Обучение генеративной нейросети — PACE TAYLOR
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more