РУБРИКАТОР:
1. КОНЦЕПЦИЯ 2. ИСПОЛЬЗОВАННЫЕ РЕСУРСЫ 3. РЕЗУЛЬТАТЫ 4. ВЫВОД
КОНЦЕПЦИЯ
В основе проекта лежит идея обучить нейросеть стилю брендинга, который я разрабатывал для продукции компании МОБИЛ К.
Мобил К — российская компания, занимающаяся производством и продажей садовой техники и инструмента. Я разрабатывал концепцию и дизайн саб-бренда линейки ручного садового инструмента — Tuscany. Целью проекта стало обучить модель ключевым особенностям брендинга Tuscany и попытаться сгенерировать различные виды упаковок с уже имеющейся продукцией Мобил К, представить упаковки в разных средах или же с совсем другими категориями товаров. Подобный эксперимент позволит быстро создать визуальное видение того, насколько саб-бренд Tuscany можно экстраполировать на другие продуктовые линейки, а так же создаст множество вариаций упаковок с которых можно подчерпнуть ценные идеи.
ИСПОЛЬЗОВАННЫЕ РЕСУРСЫ
Материалом для обучения стали упаковки созданные мной для Мобил К. Часть из них так же создавалась с помощью генеративного ИИ
Для обучения было использовано 19 вариантов концептов упаковки формата 512×512 пикселей и 1000 шагов. Было использовано такое количество изображений, так как это все готовые концепты которые были, а полноценно созданные упаковки не поддерживаются кодом, представленным в лекции. Для генерации промптов итоговых изображений я пользовался встроенной надстройкой ChatGPT Plus — Prompt Engineer. (Использованные промпты я указал в комментариях в блокноте).
Так же я использовал встроенный в ChatGPT генератор изображений для постобработки и доработки получившихся изображений.
РЕЗУЛЬТАТЫ
Первичные изображения:
Prompts:
- «product package in MBKTUSC6 style, lawnmover pacakge»
- «product package in MBKTUSC6 style, apple ipod blister package»
- «product package in MBKTUSC6 style, LEGO Rome package»
Видно что модель хорошо восприняла визуал упаковок: характер верстки и акцентных блоков, цветовые решения, характер и стиль пейзажа.
Prompts:
- «product package in MBKTUSC6 style, mini fridge square carton box with MobilK branding»
- «product package in MBKTUSC6 style, microwave cartonbox package with MobilK branding»
При попытке создать упаковку для других категорий товаров возникают сложности с их формой.
Prompts:
- «product package in MBKTUSC6 style, TV wide carton box package»
Пост-обработка в ChatGPT:
Так как обученная модель в google collab позволяла использовать лишь 77 токенов при создании промпта, а так же сама модель плохо умела разбирать текст и определять необходимую форму упаковки, я решил доработать получившиеся изображения через ChatGPT. Я улучшал читаемость текста, удалял артефакты и иногда дорабатывал форму.
Prompt: «Improve the uploaded TV package in MobilK TUSCANY style. Add the TV as a hero object on the package, make all the text clear to read, add the characteristics, place the landscape on the TV screen»
Prompt: «Improve the uploaded package in MobilK TUSCANY style. Improve the text quality, delete all the artifacts and noise, make the form of the ipod realistic»
Prompts:
- «Make the chainsaw package based on the uploaded package reference. Improve the text quality from the reference. Add a chainsaw as a hero object on the package.»
- «Improve the uploaded microvave package. Make the text clear, add characteristics, make the microvave realistic, add the kitchen background, based on the style of the package.»
Prompt: «Improve the uploaded LEGO Rome package in MobilK Tuscany style, Make the text and logos clear to read. Add the Lego parts at the package landscape»
После пост-обработки текст в большинстве случаев стал читаемым, товары на упаковках узнаваемыми, а артефакты исчезли.
ВЫВОД
Обученная LoRA модель может выдавать достаточно постоянный стилистический похожий результат, однако…
К сожалению уровень модели не позволяет ей полноценно работать с текстом, а лимит в 77 токенов для positive и negative промптов не позволяет исключить возможные «галлюцинации» в связи с малым количеством исходных данных и уточнений в промпте.
Результатом стала модель, способная точно передавать общий стиль упаковок МобилК Tuscany, которые впоследствии легко превращать в более законченные работы путем доработки в других нейросетях, так как у них будет хорошая база, от которой они легко оттолкнуться.
Подобный подход позволяет быстро визуализировать новые направления в продуктовой линейке без больших затрат времени на составление четкого описания промпта для воспроизведения необходимого стиля.