
Концепция
Цель моего проекта — обучить нейросеть понимать и воспроизводить изображение объекта: лошадей. Для обучения используются фотографии лошадей в различных позах, ракурсах и локациях. В разделе «Исходные изображения» представлены фото, включенные в базу данных для анализа и обучения.
Исходные изображения






Сгенерированные изображения

A photo of TOK horse a horse running in a field of flowers


A photo of TOK horse a horse standing in a field with the sun setting behind it


Итоговая серия изображений представляет собой генерацию фотореалистичного объекта — лошадей.
Сгенерированные изображения демонстрируют успехи в имитации такого сложного объекта, как лошадь. Получилось создать фото с разными ракурсами, планами, локациями и светом. Особенно удачно нейросети удалось передать гриву, отлив шерсти, а также динамику поз лошадей, присутствующую на референсах в базе данных.
Работа с кодом
Просмотр датасета (первые 5 изображений)
Было собрано 20 изображений с лошадьми для базы данных. Подбирались фотографии с разными ракурсами, позами, фоном, планами и другими характеристиками.
Генерируем описание к изображению
Обучение (500 шагов, сохранение каждые 250 шагов)
Код и датасет
Файл с кодом: https://disk.yandex.ru/d/cbB3TUQYlCy8kw
Датасет с фотографиями: https://disk.yandex.ru/d/NBhcSbswuP1Nmg