
Концепция
Одним из примеров классического русского творчества являются изразцы. На них могут существовать как сюжеты, так и абстракции. Их вариант с нанесением глазури и стал примером для дообучения генеративной нейросети Stable Diffusion, благодаря своей текстуре, объему и цветам.
Мне показалась очень интересной идея имитировать фотографии изразцов с различными изображениями, чтобы в дальнейшем использовать их для своих декоративных проектов.
Процесс обучения

Примеры исходных изображений
Изразцы имеют определенные, немного приглушенные, цвета и палитру. Также, плитка имеет текстуру и блеск глазури, который проявляется при разных ракурсах и съемке. Целью было обучить нейросети создавать фотографии плитки именно с этими отличительными особенностями.

После установки библиотек и нужного скрипта, я загрузила подготовленный датасет из сорока двух изображений на локальный диск в Google Colab и обратилась к ним с помощью кода.
Далее мне нужны были именно квадратные версии изображений из датасета и с помощью кода я решила эту задачу.
Теперь можно было перейти к началу обучения. Я использовала предварительно обученную модель BLIP от Salesforce для создания подписей к изображениям и дальнейшего создания промптов. Также импортировала torch для дальнейших операций и проверила, доступна ли CUDA.
Для поиска файлов, соответствующих шаблону, я и импортировала glob, а для работы с файлами изображений — PIL.Image. Также, добавила в работу json для создания файлов в данном формате.
Далее запустила код для описания каждого изображения из датасета с помощью промпта и вывела эти описания с префиксом «photo of GLAZED tiles».
Далее я импортировала gc для удаления ненужной информации, занимающей GPU. Добавила locale для того, чтобы задать использование кодировки UTF-8 для обработки текста, и запустила notebook_login из huggingface_hub для загрузки частных моделей и выгрузки учетную запись Hub.
Также, для дальнейших настроек дообучения модели, я запустила код «! accelerate config default».
Настройки для обучения собственной генеративной модели «glazed_tile_square_LoRA»
После обучения модели «glazed_tile_square_LoRA», я проверила сохранение обученных весов LoRA и создала репозиторий для модели. Далее загрузила веса LoRA в Hugging Face Hub и убедилась, что модель сохранилась, перейдя по ссылке, которая появилась.
Теперь оставалось только сгенерировать финальные изображения с помощью модели.
Пример промпта для генерации итоговой серии изображений
Итоговая серия
Итоговая серия вышла именно такой, как я и ожидала: приглушенные цвета, сохранение объема и текстуры, блеск. Также, у модели есть возможность генерации как абстрактных, так и конкретных сюжетов.
Описание применения генеративной модели
В проекте также использовались генеративные модели DeepSeek и Hugging Face для подготовки датасета с фотографиями к использованию в основном коде.
Пример запроса чату DeepSeek для генерации кода для подготовки датасета
Дополнительная информация
Ссылка на модель glazed_tile_square_LoRA: https://huggingface.co/kategrxt/glazed_tile_square_LoRA
Ссылка на Google Drive с начальным датасетом и ноутбуком: https://drive.google.com/drive/folders/1-Rkkl7DgX7Dk-HF4MeCDkaFBzr-_lH4z?usp=sharing