
Идея проекта
В рамках данного проекта была поставлена задача обучить генеративную нейросеть создавать изображения в эстетике «Неонового Токио», сочетающей элементы урбанизма, киберпанка и современной цифровой культуры.
Основной целью исследования стало изучение того, насколько искусственный интеллект способен освоить визуальный язык и атмосферу мегаполиса будущего, где главную роль играют свет, отражения и цвет.
Исходные изображения
В качестве датасета было собрано 36 бесплатных фотографий улиц Токио с сайта Unsplash.

Фотограф — Jezael Melgoza
Главная цель эксперимента заключалась в том, чтобы обучить модель не просто воспроизводить визуальные элементы, а передавать целостное ощущение атмосферы — световой, эмоциональной и композиционной. В процессе обучения особое внимание уделялось следующим аспектам:
• формированию характерной неоновой цветовой палитры и реалистичных световых переходов; • корректной передаче глубины и перспективы городского пространства; • воспроизведению эмоционального настроения, объединяющего холод урбанистической среды и эстетическую выразительность света.
Фотограф — Ayumi Kubo
Процесс обучения
Первый этап обучения — импорт нужных библиотек и загрузка датасета.
Следующим этапом было сгенерировать подписи к каждому изображению.
Дальше — уже само обучение нейросети. Для качественного, но быстрого обучения были выбраны следующие параметры:
• resolution = 512 • train_batch_size = 2 • max_train_steps = 1000 • checkpointing_steps = 250
Время обучения составило 1 час 38 минут.
Готовый результат был загружен на Hugging Face. После этого начался процесс генерации серии изображений.
Серия сгенерированных изображений
prompt: «photo collage in NEON TOKYO style, glass skyscrapers reflecting neon advertisements, modern japan, ultra-detailed»
В первом заходе нейросеть смогла сохранить общую идея неонового мегаполиса, однако стиль смещается в сторону футуризма и гиперреальности. Цветовая палитра ограничена в основном розово-фиолетовыми и пурпурными оттенками, что придаёт сцене ощущение сна или киберпанковской эстетики.


Исходное фото (фотограф — Erik Eastman) // Генерация нейросети
prompt: «photo collage in NEON TOKYO style, rainy night bus stop with glowing signs, reflections, lonely atmosphere»
prompt: «photo collage in NEON TOKYO style, rainy city street, reflections of red and purple neon, futuristic signage, moody lighting»


Генерации нейросети
prompt: «photo collage in NEON TOKYO style, crowded shinjuku crossing, vibrant lights, urban chaos, cinematic night photography»
Нейросеть искажает перспективу, а цвета создает кислотными. Люди превращены не просто в размытые силуэты, а в абстрактные потоки света и энергии, сливающиеся в единый пульсирующий организм. Здания теряют конкретику, вывески становятся символическими формами, а сам город ощущается не как физическое пространство, а как метафора цифрового будущего — переполненного, гипнотического, одновременно прекрасного и тревожного.


Исходное фото (фотограф — Denys Nevozhai) // Генерация нейросети
prompt: «photo collage in NEON TOKYO style, futuristic tokyo street blended with digital artifacts, glitch aesthetic»
prompt: «photo collage in NEON TOKYO style, monorail over futuristic city, glowing signs below, cyberpunk vibe»


Генерации нейросети
prompt: «photo collage in NEON TOKYO style, close-up of neon sign with japanese characters, glowing blue and magenta, shallow depth of field»
prompt: «photo collage in NEON TOKYO style, shop window glowing in the dark, pink and cyan tones, cinematic photography»
Преобладают розовые, малиновые и фуксии тона, с акцентами синего и фиолетового. Это не просто «розовый свет», а цветовая фильтрация всей реальности, как будто город окутан гигантским лазерным шоу.


Генерации нейросети
prompt: «photo collage in NEON TOKYO style, cyberpunk cityscape, electric blue and magenta lights, high-rise buildings, cinematic perspective»
prompt: «photo collage in NEON TOKYO style, ethereal city lights through fog, minimalist composition, neon hazec»
Здания и дороги упрощены до силуэтов, освещение — не источник света, а сама текстура пространства. Город выглядит как единый цифровой организм, где каждый пиксель светится. Цвета «затушеваны» легкой дымкой, что создаёт эффект расстояния и таинственности.


Генерации нейросети
prompt: «photo collage in NEON TOKYO style, futuristic alley in a japanese city, glowing signs, rainy atmosphere, puddles reflecting lights, cyberpunk style»
prompt: «photo collage in NEON TOKYO style, subway train arriving at neon-lit station, reflections on metal, cinematic lighting»


Генерации нейросети
prompt: «photo collage in NEON TOKYO style, reflections on puddle, blurred city lights, abstract composition»
prompt: «photo collage in NEON TOKYO style, wet glass surface with raindrops and colored reflections, bokeh background»


Генерации нейросети
Нейросеть справилась с задачей на высоком уровне, продемонстрировав впечатляющую способность к стилизации и атмосферному погружению. Она успешно передала ключевые элементы — неоновую эстетику, масштаб мегаполиса, узнаваемые символы (Токийская башня, перекрёстки), — но не как фотограф, а как художник-интерпретатор. Каждое изображение — это отдельная визуальная вселенная: от гипернеонового киберпанка до меланхоличной фиолетовой мечты. Нейросеть отлично работает с цветом, светом и композицией, создавая мощные эмоциональные эффекты.
Однако она теряет детализацию, читаемость текстов и анатомическую точность — что нормально для стилизованной генерации, но делает изображения непригодными для документальных или реалистичных задач. В целом, отличный инструмент для концептуального дизайна, арта, обложек и визуальных метафор, но не замена живому художнику. ИИ здесь — помощник, создающий вдохновляющие основы, которые требуют человеческой доработки для обретения глубины и смысла.
Описание применения генеративной модели
• Stable Diffusion— обучение генеративной нейросети.
• BLIP — генерация подписей к изображениям.
• Hugging Face — генерация токена и загрузка модели на сайт.