
Концепция
Основная цель проекта — обучить нейросеть, способную понимать и самостоятельно воспроизводить уникальные художественные стили знаменитых художник. Нейросеть учится на обширном наборе данных, состоящем из картин известных мастеров. Она анализирует характерные черты стилей и пытается их воссоздать.
В данном проекте я выбрала работы Рембрандта Харменса ван Рейна в качестве основы для обучения искусственного интеллекта. В проекте также представлены примеры картин, включенных в базу данных для обучения нейросети.
Исходные изображения
Картины Рембрандта отличаются глубокой эмоциональностью, реалистичностью и мастерской игрой света и тени. Он создавал живые, психологически сложные портреты, а также религиозные и мифологические сцены, пронизанные драматизмом и гуманизмом.
«Портрет женщины с собачкой», 1662

«Жертвоприношение Исаака», 1635


«Ночной дозор», 1642
«Возвращение блудного сына», 1662

«Похищение Европы», 1632

Работы Рембрандта характеризуются насыщенной цветовой палитрой, грубой фактурой мазков и вниманием к деталям, позволяющим передать не только внешний вид, но и внутренний мир персонажей.
Сгенерированные изображения

«REMBRANDT style group of people», «REMBRANDT style working men», «REMBRANDT style camel in a desert»


«REMBRANDT style elderly people», « REMBRANDT style princess»
Сгенерированные нейросетью изображения, вдохновленные работами Рембрандта, демонстрируют определенные успехи в имитации его стиля. Можно заметить попытки воспроизведения характерной для Рембрандта светотени (кьяроскуро), с использованием темного фона и высветлением ключевых элементов композиции. В некоторых изображениях прослеживается стремление к передаче глубины и объема, а также характерной для художника мягкости мазков.
Тем не менее нейросети пока сложно воссоздать ту тонкую игру света и тени, ту живость и реалистичность человеческих лиц, которыми славился Рембрандт. Также сгенерированные изображения имеют проблемы с детализацией и анатомией человека.


«REMBRANDT style three dogs», «REMBRANDT style boat in the sea»
Процесс обучения нейросети начинается с подготовки данных, которая включает в себя сбор, очистку и форматирование информации. После этого подготовленные данные делятся на три выборки: обучающую, валидационную и тестовую. Затем осуществляется обучение модели: в нейросеть передается обучающая выборка, и параметры настраиваются с помощью алгоритма оптимизации для минимизации функции потерь.
Эффективность нейросети оценивается на валидационной выборке с целью предотвращения переобучения. Затем осуществляется оптимизация гиперпараметров (таких как скорость обучения и размер батча) для достижения оптимальных результатов. Оценка обобщающей способности обученной нейросети происходит на текстовой выборке. И в конце, обученная нейросеть применяется для решения практических реальных задач.


«REMBRANDT style animals in the forest», «REMBRANDT style knights»
«REMBRANDT style royal palace», «REMBRANDT style sunset», «REMBRANDT style fish in the sea»
Вывод
В целом, обучение нейросетей для генерации изображений является крайне перспективной областью, способной кардинально изменить методы создания и восприятия визуального контента.
Эти технологии предоставляют уникальные возможности для художников, дизайнеров и всех других творческих людей. Предлагая им эффективные инструменты для реализации их концепций и творческих идей. В то же время, необходимо осознавать и принимать во внимание возможные риски.
Для полноценной реализации потенциала нейросетей в искусстве и других сферах требуется разработка этических норм, а также регулирование применения этих технологий и формирование культуры ответственного использования, что позволит избежать негативных последствий.
Генеративная модель
В работе над проектов был задействован GPT-ChatBot. Основные задачи: генерация текстовых промтов для нейросети и поиск информации.
Файл с кодом