Original size 1140x1600

Улицы Токио глазами искусственного интеллекта

PROTECT STATUS: not protected
6

Идея проекта

В рамках данного проекта была поставлена задача обучить генеративную нейросеть создавать изображения в эстетике «Неонового Токио», сочетающей элементы урбанизма, киберпанка и современной цифровой культуры.

Основной целью исследования стало изучение того, насколько искусственный интеллект способен освоить визуальный язык и атмосферу мегаполиса будущего, где главную роль играют свет, отражения и цвет.

Исходные изображения

В качестве датасета было собрано 36 бесплатных фотографий улиц Токио с сайта Unsplash.

big
Original size 5262x3720

Фотограф — Jezael Melgoza

Главная цель эксперимента заключалась в том, чтобы обучить модель не просто воспроизводить визуальные элементы, а передавать целостное ощущение атмосферы — световой, эмоциональной и композиционной. В процессе обучения особое внимание уделялось следующим аспектам:

• формированию характерной неоновой цветовой палитры и реалистичных световых переходов; • корректной передаче глубины и перспективы городского пространства; • воспроизведению эмоционального настроения, объединяющего холод урбанистической среды и эстетическую выразительность света.

Original size 5262x3720

Фотограф — Ayumi Kubo

Процесс обучения

Первый этап обучения — импорт нужных библиотек и загрузка датасета.

Original size 1401x707
0

Следующим этапом было сгенерировать подписи к каждому изображению.

Original size 1549x581
0

Дальше — уже само обучение нейросети. Для качественного, но быстрого обучения были выбраны следующие параметры:

• resolution = 512 • train_batch_size = 2 • max_train_steps = 1000 • checkpointing_steps = 250

Время обучения составило 1 час 38 минут.

Original size 899x537

Готовый результат был загружен на Hugging Face. После этого начался процесс генерации серии изображений.

0
Original size 1721x655

Серия сгенерированных изображений

prompt: «photo collage in NEON TOKYO style, glass skyscrapers reflecting neon advertisements, modern japan, ultra-detailed»

В первом заходе нейросеть смогла сохранить общую идея неонового мегаполиса, однако стиль смещается в сторону футуризма и гиперреальности. Цветовая палитра ограничена в основном розово-фиолетовыми и пурпурными оттенками, что придаёт сцене ощущение сна или киберпанковской эстетики.

Исходное фото (фотограф — Erik Eastman) // Генерация нейросети

prompt: «photo collage in NEON TOKYO style, rainy night bus stop with glowing signs, reflections, lonely atmosphere»


prompt: «photo collage in NEON TOKYO style, rainy city street, reflections of red and purple neon, futuristic signage, moody lighting»

Генерации нейросети

prompt: «photo collage in NEON TOKYO style, crowded shinjuku crossing, vibrant lights, urban chaos, cinematic night photography»

Нейросеть искажает перспективу, а цвета создает кислотными. Люди превращены не просто в размытые силуэты, а в абстрактные потоки света и энергии, сливающиеся в единый пульсирующий организм. Здания теряют конкретику, вывески становятся символическими формами, а сам город ощущается не как физическое пространство, а как метафора цифрового будущего — переполненного, гипнотического, одновременно прекрасного и тревожного.

Исходное фото (фотограф — Denys Nevozhai) // Генерация нейросети

prompt: «photo collage in NEON TOKYO style, futuristic tokyo street blended with digital artifacts, glitch aesthetic»


prompt: «photo collage in NEON TOKYO style, monorail over futuristic city, glowing signs below, cyberpunk vibe»

Генерации нейросети

prompt: «photo collage in NEON TOKYO style, close-up of neon sign with japanese characters, glowing blue and magenta, shallow depth of field»


prompt: «photo collage in NEON TOKYO style, shop window glowing in the dark, pink and cyan tones, cinematic photography»

Преобладают розовые, малиновые и фуксии тона, с акцентами синего и фиолетового. Это не просто «розовый свет», а цветовая фильтрация всей реальности, как будто город окутан гигантским лазерным шоу.

Генерации нейросети

prompt: «photo collage in NEON TOKYO style, cyberpunk cityscape, electric blue and magenta lights, high-rise buildings, cinematic perspective»


prompt: «photo collage in NEON TOKYO style, ethereal city lights through fog, minimalist composition, neon hazec»

Здания и дороги упрощены до силуэтов, освещение — не источник света, а сама текстура пространства. Город выглядит как единый цифровой организм, где каждый пиксель светится. Цвета «затушеваны» легкой дымкой, что создаёт эффект расстояния и таинственности.

Генерации нейросети

prompt: «photo collage in NEON TOKYO style, futuristic alley in a japanese city, glowing signs, rainy atmosphere, puddles reflecting lights, cyberpunk style»


prompt: «photo collage in NEON TOKYO style, subway train arriving at neon-lit station, reflections on metal, cinematic lighting»

Генерации нейросети

prompt: «photo collage in NEON TOKYO style, reflections on puddle, blurred city lights, abstract composition»


prompt: «photo collage in NEON TOKYO style, wet glass surface with raindrops and colored reflections, bokeh background»

Генерации нейросети

Нейросеть справилась с задачей на высоком уровне, продемонстрировав впечатляющую способность к стилизации и атмосферному погружению. Она успешно передала ключевые элементы — неоновую эстетику, масштаб мегаполиса, узнаваемые символы (Токийская башня, перекрёстки), — но не как фотограф, а как художник-интерпретатор. Каждое изображение — это отдельная визуальная вселенная: от гипернеонового киберпанка до меланхоличной фиолетовой мечты. Нейросеть отлично работает с цветом, светом и композицией, создавая мощные эмоциональные эффекты.

Однако она теряет детализацию, читаемость текстов и анатомическую точность — что нормально для стилизованной генерации, но делает изображения непригодными для документальных или реалистичных задач. В целом, отличный инструмент для концептуального дизайна, арта, обложек и визуальных метафор, но не замена живому художнику. ИИ здесь — помощник, создающий вдохновляющие основы, которые требуют человеческой доработки для обретения глубины и смысла.

Описание применения генеративной модели

Stable Diffusion— обучение генеративной нейросети.

BLIP — генерация подписей к изображениям.

Hugging Face — генерация токена и загрузка модели на сайт.

Улицы Токио глазами искусственного интеллекта
6
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more