研究の問い / 技術の機能 Question
顔認識や表情解析では眼鏡がノイズとなりやすく、眼鏡なし画像が必要なケースが多くあります。CGで眼鏡付き顔画像を大量生成して学習データとし、眼鏡除去AIモデルを開発することで、実際の眼鏡装着者からでも眼鏡なし状態を自然に再現できるかを検証しました。データの不足を人工生成で補う、実践的なアプローチです。
眼鏡除去生成モデルとは
眼鏡除去生成モデルとは、ディープラーニングの画像生成技術を用いて、眼鏡を着用した顔画像から眼鏡のみを除去した自然な顔画像を生成する処理系です。顔認識・表情解析の前処理基盤として機能します。
プロジェクト概要 Project Overview
眼鏡を着用した顔画像から眼鏡部分を除去し、自然な眼鏡無し顔画像を生成するAIモデル基盤を構築した事例です。ディープラーニングの生成モデルを用い、眼鏡による外観変化を補正する画像生成技術をオルチェが開発しました。
-
目的
-
眼鏡という付加要素を補正できる画像処理基盤の構築
-
入力
-
眼鏡着用顔画像
-
出力
-
眼鏡無し顔画像(同一人物)
-
学習データ
-
CGで生成した大規模な眼鏡付き顔画像データセット
背景・課題 Background
顔認識や表情解析において、眼鏡は重要な外的要因となります。フレーム形状や反射による特徴抽出への影響、視線・目元解析の妨げ、顔画像データのばらつき増加といった課題があり、眼鏡の影響を補正できる前処理技術が求められていました。
-
01
フレームの形状や反射が顔の特徴点検出や認識精度に影響を与えていました。
-
02
視線・目元解析の妨げ
眼鏡によって目元が隠れたり反射したりすると、視線や瞬目の解析が困難になります。
-
03
データばらつきの増加
眼鏡の有無・種類が異なると同一人物でも顔画像の特徴量にばらつきが生じます。
アプローチ Approach
生成モデルを用いて眼鏡を除去した顔画像を出力する処理系を設計しました。大量のCG生成データで学習することで、多様な眼鏡スタイルに対応できるモデルを構築しています。
-
学習データ設計 Training Data
- 多種多様な眼鏡フレームをCGで顔画像に付加
- 異なる角度の顔画像を生成
- 形状・大きさ・色・位置を多角度でカバー
人工的に生成した大量データにより、現実的かつ多様な学習データセットを構築しました。
approach-training-data.png -
モデル学習構造 Model Architecture
- 入力:眼鏡着用顔画像
- 出力:眼鏡無し顔画像(生成モデルによる変換)
- 眼鏡の特徴を学習し、適切に除去する処理を習得
ディープラーニング生成モデルが眼鏡のパターンを学習し、自然な除去画像を生成します。
approach-model-architecture.png
得られた知見・成果 Results
本プロジェクトにより、CG生成による大規模学習データ構築手法・眼鏡除去生成モデル・外的付加物を補正する画像前処理基盤を構築しました。眼鏡による外観変動を補正可能な処理系を整備しています。
-
01
CG学習データ生成手法を確立
大量の人工データを効率的に生成する手法を構築し、多様な眼鏡スタイルに対応した学習基盤を整備しました。
-
02
眼鏡除去AIモデルを完成
眼鏡着用画像から自然な眼鏡無し画像を生成できる生成モデルを実装しました。
-
03
汎用前処理基盤を提供
顔認識・表情解析・視線解析など多様な研究プロジェクトで再利用可能な基盤を整備しました。
位置付け・展望 Position & Outlook
見出しサンプル
本基盤は、顔画像解析を行うさまざまな研究・実務プロジェクトで再利用可能な汎用技術です。オルチェが提供する眼鏡除去モデルは、顔認識精度の向上や目元解析の精緻化を支える前処理基盤として機能します。
- 顔認識・表情認識精度の向上
- 視線・目元解析の前処理
- プロフィール画像の補正・標準化
見出しサンプル
顔は感情を映す鏡であると同時に、個人を識別する印でもあります。表情と個人性は一見分離不可能に見えますが、それらを別の軸として切り分けることができれば、表情研究にも個人特性研究にも新しい可能性が開けます。本研究で構築した個人性モーフィングのアルゴリズムは、その切り分けを安全かつ再現可能な形で扱うための道具です。
人の顔には、表情とは別に、その人らしさがあります。オルチェは、その個性のかたちをそっと理解する研究を続けています。