adtech studio

【AI Lab】国際会議「CVPR 2018」ビジュアル広告理解のワークショップ「ADS」にて技術コンペ1位で通過!6/22@USで発表

hiroko By hiroko

インタビュー

みなさんこんにちは、技術広報の田爪です。


今週、6/18(月)からソルトレークシティで行われている「CVPR2018」※1にて開催されている、ビジュアル広告を理解するためのワークショップ「ADS」のコンペティションにAI Labのクリエイティブリサーチのメンバーで挑戦していたのですが、なんと…1で技術コンペ通過となりました!
6/22(金)にソルトレークシティ現地にてコンペの技術詳細について発表もおこないます。
 ※1コンピュータビジョンやパターン認識の分野における国際会議

『AI Lab』のクリエイティブリサーチチームでは、
「広告クリエイティブの自動制作支援と自動生成」について研究開発を進めており、大学や研究機関との産学連携も進めながらアカデミックで進めている研究技術を、広告の配信技術やクリエイティブ生成技術に活かすべく日々研究開発を行っています。

関連リリース
「AI Lab」、バージニア大学の研究者らとの共著論文が、コンピュータビジョン分野の国際会議「CVPR」にて採択
【AI Lab】国際会議のCVPR@USに続き、CHI@Canadaのワークショップも2本採択! 採択論文概要とAI Labの研究オフィス紹介

 

このような活動の中、今回の「CVPR2018」ではAI Labから4つの発表を予定しています。

1:「Feedback-prop: 部分観測からのフィードバック推論」
AI Lab研究員山口によるCVPR本会議で採択された共著論文の発表。

全世界から約3,300本の論文が投稿され、うち979本が採択、約30%の採択率という難関です…!
2:今回のビジュアル広告を理解する「ADS」ワークショップ、コンペ1位通過による発表!
3:同ワークショップにおける、機械学習を用いたストック写真素材の印象操作に関するポスター発表
4:そして言語と画像理解のためのLanguage and Visionワークショップにてポスター発表!

たくさんの発表が行われるCVPR2018、今回1位通過したコンペティションについて詳しく研究員に聞いてみました。

ビジュアル広告の理解のためのワークショップ「ADS」
コンペティション1位通過!US現地で発表へ

--コンペ1位通過おめでとうございます!
まずはどういう形でコンペが行われるのか?など詳しく教えてください

CVPRでは本会議以外にもコンピュータビジョンの多数の詳細研究領域についてのワークショップが開催されます。今回はADにもAI Lab大谷が言語と画像理解のためのLanguage and Visionワークショップにてポスター発表を予定しております。今回1位で通過したのはビジュアル広告の理解のためのワークショップ「ADS」の中で行われた画像認識を競うコンペ。与えられた広告画像のデータセットに対する認識性能を競います。競技は3−4月の準備期間を経て、5−6月の競技期間中に正解が不明なテストデータに対する性能を主催者側が判定するという形で行われます。(山口)

--今回の課題は具体的にどのような内容ですか?

今回の課題は、あるバナー画像について与えられた15個のテキストから正しい記述を1つ選び出すというタスクの性能を競います。15個中正解となりうるものが3つ含まれているのでこの3つのどれかを当てれば正解となります。バナー画像を対象としているため、例えばチラシのように商品と価格が並んだものから禁煙や自然保護を訴える印象的な広告まで、幅広い対象を認識する必要がある点が難しい設問になっています。我々は多くの広告画像に含まれるテキスト領域に着目し、深層学習を用いた画像認識モデルに文字認識モデル(OCR)を組み合わせた手法で1位を獲得することができました。(山口)


 

--たとえば、今回の手法/提案を活かすと広告ではどんなことが期待できるのでしょう?

広告画像が何を表現しているのかを直接理解するための技術は、様々な応用が期待できます。例えば広告クリエイティブの制作者は制作現場でリアルタイムに広告の受け手の印象や理解内容のフィードバックを受けることができるようになります。意図しない表現があればすぐに修正を加えることができますし、どんな箇所に視線が集まりそうかといった情報を推定することも可能になります。また、自動で広告を生成した場合の表現の品質評価に使うことで、制作自動化技術・制作支援技術の改善に繋がることが期待できます。(山口)

AI Labのクリエイティブリサーチチームで研究をすすめている、『広告クリエイティブ自動製作支援と自動生成』の研究テーマにどんぴしゃのコンペティションで1位という結果、とてもうれしいです!

■同ワークショップでのポスター発表について

--同ワークショップでポスター発表を行う大田さんです
今回の発表をもとに、今後の意気込みやカンファレンスから持ち帰りたいことなどあれば教えてください。

–大田
ADS ワークショップでは上記コンペに加えて広告画像データに関連するショート論文の募集も行われました。我々が目下研究の対象としている広告クリエイティブデータですが、製作時に素材となる画像を広告の訴求や印象に合わせてレタッチする作業が頻繁に行われます。今回は、人々が画像に対して抱いた感情情報データを元に学習を行うことで、画像を特定の感情に沿うようにレタッチする手法を提案しています。これにより例えばデザイナーが素材を編集する際に特定の感情に基づくレタッチガイドラインを提示することが可能になると考えています。

▼画像を感情に沿うようにレタッチした一例

研究としてはまだまだ浅い内容のため、現地でワークショップ参加者と議論することで新たな着想や改善点についてのヒントを得ることができればと思っています。

たしかにレタッチが違うだけで画像から受け取る印象がとても違います・・・
様々な切り口から画像に関する研究を行っている『AI Lab』クリエイティブリサーチチーム。
今まさに現地でインプット&アウトプットに取り組んでいます!

アドテクスタジオ、AI Labでは多くの国際カンファレンスや学会に参加していますが、インプットだけではなくアウトプットの場としてもどんどん挑戦しています。

CVPRに関する詳細のレポートは、参加後にAI Labのリサーチブログにおいて参加レポートを予定しております。
ぜひご覧ください。