ウェブトゥーンチャプター一括着色ガイド
一括着色パイプラインを構築した理由、直面したエンジニアリング上の課題、そしてプロダクション規模のチャプター着色に本当に必要なこと。
Watashi Games 発行 · 2026年3月
一括着色が出版社にとって革命的な理由
ウェブトゥーンのチャプターを出版用に着色し始めたとき、最初に学んだのは、単一画像の着色ツールはプロダクション作業には本質的に役に立たないということでした。典型的なウェブトゥーンのチャプターは40〜80ページあります。1枚ずつ着色すると、たとえ高速なAIツールを使っても、ページごとに色が一貫しません。キャラクターの髪が12ページ目では赤茶色なのに、13ページ目では栗色になることも。背景の色合いがパネル間で変わってしまう。結果は、ページごとに別のアーティストが着色したような仕上がりになります。
一括着色は単なるスピードの問題ではありません。チャプター全体をひとつの作業単位として扱うことです。人間のカラリストがチャプターを手がける場合、最初のページでパレットを確立し、それを引き継ぎます。シーンの転換を見て雰囲気を維持します。3ページ前の壁の色を忘れたりしません。プロダクショングレードの着色ツールはその連続性を再現する必要があり、それはツールがチャプター全体を一度に処理する場合にのみ可能です。
これが、Watashi Colorizer を最初から一括パイプラインとして構築した核心的な理由です。バッチモードを後付けした単一画像ツールではなく、チャプターをつながりのあるアートのシーケンスとして理解するようにゼロから設計されたシステムです。
エンジニアリングの課題:ページをまたぐ色の一貫性
一括着色で最も難しい問題は処理速度ではなく、一貫性です。AIモデルは固定サイズのバッチで画像を処理し、異なるバッチは同じコンテンツに対してわずかに異なる色解釈を生み出します。シーンが30ページの下部で始まり31ページの上部に続く場合、それらが異なるバッチに入ると、アクションの真ん中に目に見える色の継ぎ目が生じます。
私たちの解決策は仮想画像分割でした。ページ全体をAIに送る代わりに、各ページの黒いパネル区切り線(ウェブトゥーン形式でシーンを分ける純黒の水平帯)をスキャンします。これらの区切り線でページを個別のアートバンドに分割し、ページ境界を越えてシーンの連続性に基づいてバンドを再グループ化します。30ページの下部と31ページの上部は同じAIバッチに入り、モデルがそれらを一緒に見て着色します。
これには数ヶ月の調整が必要でした。区切り線の検出は、純黒のパネル区切りと、影、髪、夜のシーンなどの暗いアートコンテンツを区別しなければなりません。すべての画像のすべての行をスキャンし、RGBの閾値15でピクセルを分類します — ほぼ純黒のみがカウントされます。微妙なグレースケール値(チャネルあたり10〜30)を含む可視テクスチャがあるものは、アートとして認識され、そのまま保持されます。
単一画像からフルチャプターへ:パイプラインの構築
完全なパイプラインは4つのステージで動作します。まず、アップロードされたすべての画像をスキャンし、検出された黒い空白部分で仮想画像に分割します。次に、それらの仮想画像をシーンの連続性に基づいてバッチ化し、AIが十分な解像度を受け取れるよう最大アスペクト比を尊重します。第三に、各バッチは1つの縦長画像にスティッチされ、AIに送信され、着色結果が再びスライスされます。第四に、すべての着色済みバンドが元のキャンバス上に正確な元の寸法で合成されます。
バッチ処理ステップが最も複雑です。隣接する仮想画像間のすべての境界をスコアリングし、完全に黒い行をスキャンします — ピクセルの暗さを平均するのではなく、95%以上のピクセルが純黒である行をカウントします。境界のスコアが高ければ、バッチを分割しても安全です。スコアが低ければ、境界をまたぐアートがあるため、それらの画像を一緒に保持します。この行ベースのスコアリングは、黒背景上のセリフテキスト1行など、ピクセル平均では見逃される詳細を捉えます。
アプローチを形作ったプロダクション要件
いくつかのプロダクション要件がアーキテクチャの決定を推進しました。出力は正確に元の寸法でなければなりません — 出版社は既存のワークフローに直接差し替えできるファイルを必要とします。キャラクターの色は16進数レベルで制御可能でなければなりません。出版社には確立されたスタイルガイドがあるからです。ツールは漫画、マンファ、マンホア、ウェブトゥーンの各形式を手動設定なしで処理できなければなりません。プロダクションチームがシリーズごとに設定を調整する必要があってはならないからです。
また、大規模では圧縮が重要であることも学びました。1枚の2000×8000ピクセルのPNGページは10MB以上になりえます。60ページを掛けると、1チャプターで600MBがパイプラインを通過します。取り込み時の自動圧縮 — 寸法を変えずにオーバーサイズのPNGをJPEG q92に再エンコード — により、可視品質のすべてのピクセルを保持しながら100MB未満に削減されます。
これらは単一のテスト画像を着色するときには考えないことです。100番目のチャプターの後に表面化する要件であり、パイプラインの効率と出力の一貫性が使えるツールとおもちゃの違いになります。
着色済みチャプターの出版から学んだこと
数十シリーズにわたる数千ページの着色を経て、最も重要な教訓は、一貫性がピーク品質に勝るということです。すべてのページが良いチャプターは、5ページが見事で残りが目に見えて異なるチャプターよりもはるかに出版可能です。キャラクターパレット、コンテキスト学習、シーン認識バッチ処理はすべて、チャプター全体が一人のアーティストが着色したように見えるという単一の目標に奉仕します。
第二の教訓は、編集は任意ではないということです。AIがどれだけ良くなっても、一部のパネルには手動調整が必要です。キャラクターの目の色がずれることがあります。背景の雰囲気がスクリプトと合わないことがあります。私たちの編集モードでは、チャプター全体を再処理せずに特定のパネルを修正する自然言語の指示が可能です。プロダクションにおいては、的確な修正を行う能力は初期の着色品質と同じくらい重要だからです。