Главная Watashi Games
← Back to guides

Почему большинство ИИ-колоризаторов манги выдают несогласованный шлак

Большинство колоризаторов — это одна ИИ-модель в чужом плаще. Вот что вам это стоит и что вместо этого делает специально созданный конвейер.

Почему большинство ИИ-колоризаторов манги выдают несогласованный шлак

Шлак вам не мерещится

Вы загружаете главу в какой-нибудь бесплатный ИИ-колоризатор. Первая страница выглядит прилично. К пятой странице волосы вашего протагониста незаметно превращаются из чёрных в каштановые. К десятой странице речевой пузырь размазан по фону, разделитель панелей заполнен нагаллюцинированной кашей, а лицо расплылось в зловещую долину. Это и есть ИИ-шлак — и дело не в невезении. Дело в архитектуре.

Почти каждый «ИИ-колоризатор манги» в интернете под капотом устроен одинаково: это тонкая обёртка вокруг одной универсальной модели изображений. Загружаете картинку, модель угадывает цвета, вы получаете результат обратно. В этом весь продукт. Он работает для одной эффектной панели и разваливается в тот момент, когда вам нужна целая глава.

Мы построили противоположное. Не обёртку — конвейер. Эта статья о том, почему подход-обёртка структурно обречён давать несогласованные результаты и что мы делаем иначе, чтобы вся серия выглядела так, будто её раскрасил один художник за один присест.

Black-and-white manga page before colorizationЧ/Б
The same page, AI-colorizedЦвет
Настоящая страница манги — шесть панелей, несколько разных сцен, один персонаж, который остаётся строго в образе на каждой из них, и смешанный англо-японский диалог, сохранённый чётким через всё раскрашивание. Это как раз тот многосценовый случай, который ИИ-обёртки не способны удержать.

Как на самом деле выглядит «ИИ-шлак»

Как только вы узнаёте эти признаки, развидеть их уже невозможно. Колоризаторы-обёртки проваливаются четырьмя предсказуемыми способами.

  • Дрейф цвета. Самый частый провал. Волосы, глаза и одежда персонажа переугадываются на каждой странице, потому что у модели нет памяти о предыдущей — тут каштановые волосы, там рыжеватые, а в тёмной панели почти чёрные. На протяжении главы это читается как неряшливость; на протяжении серии это просто непригодно.
  • Нагаллюцинированные детали. Универсальные модели не умеют оставить всё как есть. Они «услужливо» заполняют сплошь чёрные разделители панелей выдуманной текстурой, замалёвывают скринтон и добавляют детали, которых никогда не было в вашем контурном рисунке.
  • Искажённые текст и лица. Поскольку эти инструменты уменьшают вашу страницу до небольшого рабочего размера, плотный текст и тонкие черты лица возвращаются искажёнными приближениями.
  • Постраничная рулетка стиля. Настроение освещения, насыщенность и палитра меняются от страницы к странице, так что готовая глава выглядит так, будто её передавали по кругу дюжине разных колористов.

Почему обёртка никогда этого не исправит

Это не баги, которые сайт-обёртка может залатать, — это следствия самого подхода. Универсальная модель изображений обрабатывает одну картинку изолированно. У неё нет понятия «это страница 34 истории, где главный герой носит тёмно-синюю куртку». Каждый запрос начинается с нуля.

Так что сайт в тупике. Он не может гарантировать цвета вашего персонажа, потому что не отслеживает вашего персонажа. Он не может защитить ваши чёрные разделители или ваш текст, потому что не знает, какие метки — это структура, а какие — арт. Он не может сохранить согласованное освещение сцены, потому что никогда не видел сцену — только один её кадр. Подкрутка промптов вокруг модели, которой вы не управляете, — это гадание на удачу, а не инженерия.

Обёртку всегда можно распознать: одно изображение за раз, никакой памяти о персонаже, никакого контроля палитры и результаты, которые отлично выглядят в тщательно отобранном демо и разваливаются на вашей реальной главе.

Что вместо этого делает специально созданный конвейер

Мы не обернули модель — мы построили вокруг неё систему раскрашивания, нацеленную ровно на то, что важно: согласованность на протяжении всего массива работ. В общих чертах вот что это вам даёт.

  • Палитры персонажей. Вы определяете персонажа один раз — волосы, глаза, кожу, фирменную одежду — и эти цвета применяются на каждой странице, где этот персонаж появляется. Куртка главного героя одного и того же тёмно-синего цвета на странице 2 и на странице 502.
  • Межпанельный контекст. Конвейер раскрашивает ваши страницы с учётом окружающих сцен, так что цвета и освещение переносятся через последовательность, а не сбрасываются на каждом кадре.
  • Обработка с учётом сцены. Она понимает разницу между структурным чёрным, скринтоном, текстом и артом — так что разделители остаются чистыми, плотный текст выживает, а тёмные сцены не «исправляются» в грязь.
  • Согласованность в масштабе серии. В этом весь смысл. Загружайте главу за главой, и мир остаётся целостным: тот же персонаж, те же цвета окружения, тот же вид, от начала до конца.
  • Настоящий контроль и оригинальный результат. Управляйте цветами простыми текстовыми указаниями, исправляйте любую отдельную панель в режиме редактирования, обрабатывайте целые главы массово и скачивайте в точном разрешении вашего оригинала — без сюрпризов в виде уменьшения и повторного сжатия.

Мы не собираемся раскрывать вам внутреннее устройство — конкретный механизм это как раз та часть, которую конкуренты не могут скопировать. Но результат и есть суть предложения: вы получаете раскрашенную главу, которую можно публиковать, а не мешок красивых, но не связанных между собой картинок.

Black-and-white manga page before colorizationЧ/Б
The same page, AI-colorizedЦвет
Другой жанр, та же дисциплина: багряные волосы воина и серебряные доспехи идентичны на всей боевой странице — никакого дрейфа от панели к панели.

Доказательство — в согласованности

Слова ничего не стоят, поэтому вот тот самый тест, который проваливает каждая обёртка: один и тот же персонаж на разных панелях, раскрашенный по единой палитре. Следите за волосами, глазами, одеждой — они не меняются.

Black-and-white manga page before colorizationЧ/Б
The same page, AI-colorizedЦвет
Семь панелей задымлённого игорного притона — игрок остаётся в образе на каждом кадре реакции, драматичное освещение держится, а английский и японский текст в речевых пузырях остаётся резким. Насыщенные страницы — это именно то место, где обёртки разваливаются.

Итог

Обёртка может сделать одну красивую картинку. Но задача не в этом. Задача — сотня страниц, где ваш протагонист узнаваемо один и тот же человек в той же одежде при согласованном освещении — глава, о чёрно-белом прошлом которой читатель забывает. Для этого нужен конвейер, а не поле для промпта.

Если вы сражались с бесплатным инструментом, который перекрашивает ваших персонажей на каждой странице, вы уже понимаете разницу. Принесите главу и посмотрите, как она держится вместе.

Раскрасьте главу, которая действительно держится вместе

Originally published on Watashi Colorizer.

More Colorizer guides