Тренировка ИИ модели для брендинга MobilK Tuscany на HSE Design

РУБРИКАТОР:

1. КОНЦЕПЦИЯ 2. ИСПОЛЬЗОВАННЫЕ РЕСУРСЫ 3. РЕЗУЛЬТАТЫ 4. ВЫВОД

КОНЦЕПЦИЯ

В основе проекта лежит идея обучить нейросеть стилю брендинга, который я разрабатывал для продукции компании МОБИЛ К.

Мобил К — российская компания, занимающаяся производством и продажей садовой техники и инструмента. Я разрабатывал концепцию и дизайн саб-бренда линейки ручного садового инструмента — Tuscany. Целью проекта стало обучить модель ключевым особенностям брендинга Tuscany и попытаться сгенерировать различные виды упаковок с уже имеющейся продукцией Мобил К, представить упаковки в разных средах или же с совсем другими категориями товаров. Подобный эксперимент позволит быстро создать визуальное видение того, насколько саб-бренд Tuscany можно экстраполировать на другие продуктовые линейки, а так же создаст множество вариаций упаковок с которых можно подчерпнуть ценные идеи.

ИСПОЛЬЗОВАННЫЕ РЕСУРСЫ

Материалом для обучения стали упаковки созданные мной для Мобил К. Часть из них так же создавалась с помощью генеративного ИИ

Блокнот с кодом

Для обучения было использовано 19 вариантов концептов упаковки формата 512×512 пикселей и 1000 шагов. Было использовано такое количество изображений, так как это все готовые концепты которые были, а полноценно созданные упаковки не поддерживаются кодом, представленным в лекции. Для генерации промптов итоговых изображений я пользовался встроенной надстройкой ChatGPT Plus — Prompt Engineer. (Использованные промпты я указал в комментариях в блокноте).

Так же я использовал встроенный в ChatGPT генератор изображений для постобработки и доработки получившихся изображений.

РЕЗУЛЬТАТЫ

Первичные изображения:

Prompts:

«product package in MBKTUSC6 style, lawnmover pacakge»
«product package in MBKTUSC6 style, apple ipod blister package»
«product package in MBKTUSC6 style, LEGO Rome package»

Видно что модель хорошо восприняла визуал упаковок: характер верстки и акцентных блоков, цветовые решения, характер и стиль пейзажа.

Prompts:

«product package in MBKTUSC6 style, mini fridge square carton box with MobilK branding»
«product package in MBKTUSC6 style, microwave cartonbox package with MobilK branding»

При попытке создать упаковку для других категорий товаров возникают сложности с их формой.

Исходный размер 1024x1024

Prompts:

«product package in MBKTUSC6 style, TV wide carton box package»

Пост-обработка в ChatGPT:

Так как обученная модель в google collab позволяла использовать лишь 77 токенов при создании промпта, а так же сама модель плохо умела разбирать текст и определять необходимую форму упаковки, я решил доработать получившиеся изображения через ChatGPT. Я улучшал читаемость текста, удалял артефакты и иногда дорабатывал форму.

Prompt: «Improve the uploaded TV package in MobilK TUSCANY style. Add the TV as a hero object on the package, make all the text clear to read, add the characteristics, place the landscape on the TV screen»

Prompt: «Improve the uploaded package in MobilK TUSCANY style. Improve the text quality, delete all the artifacts and noise, make the form of the ipod realistic»

Prompts:

«Make the chainsaw package based on the uploaded package reference. Improve the text quality from the reference. Add a chainsaw as a hero object on the package.»
«Improve the uploaded microvave package. Make the text clear, add characteristics, make the microvave realistic, add the kitchen background, based on the style of the package.»

Prompt: «Improve the uploaded LEGO Rome package in MobilK Tuscany style, Make the text and logos clear to read. Add the Lego parts at the package landscape»

После пост-обработки текст в большинстве случаев стал читаемым, товары на упаковках узнаваемыми, а артефакты исчезли.

ВЫВОД

Обученная LoRA модель может выдавать достаточно постоянный стилистический похожий результат, однако…

К сожалению уровень модели не позволяет ей полноценно работать с текстом, а лимит в 77 токенов для positive и negative промптов не позволяет исключить возможные «галлюцинации» в связи с малым количеством исходных данных и уточнений в промпте.

Результатом стала модель, способная точно передавать общий стиль упаковок МобилК Tuscany, которые впоследствии легко превращать в более законченные работы путем доработки в других нейросетях, так как у них будет хорошая база, от которой они легко оттолкнуться.

Подобный подход позволяет быстро визуализировать новые направления в продуктовой линейке без больших затрат времени на составление четкого описания промпта для воспроизведения необходимого стиля.