2020年08月20日 12:00

【自分そっくりに話すAI「DeepAICopy」の動画がよりリアルに】声・見た目が本人そっくりな映像がリアルタイムに、よりリアルになりました。

  • このエントリーをはてなブックマークに追加


2020年8月20日、クリスタルメソッド株式会社は、発話中の人の顔の動画音声収録データを学習させることによって、あたかも本人が発話しているかのように、音声合成・リップシンクするオリジナルAIを作成する技術を開発。その動画がこれまでよりもよりリアルに生まれ変わりました。

https://www.youtube.com/watch?v=oyhWZXcTqlw
▲Zoomミーティングで対話するAI


■リアルな動画に生まれ変わったことによるメリット
リアルな動画に生まれ変わった事によるメリットは、AI特有の“不気味”の谷を乗り越えたことです。見てて気持ち悪いという事はなくなり、自然な動画になっています。


■リアルな動画に生まれ変わるために施した技術的な変更点
前バージョンでは、リップシンク部分のみの生成だったのですが、今バージョンでは動画全体に前後関係を含めて生成しています。AIで推定する部分を5つ以上追加して複雑な動きに対応しています


■動画がリアルになったことで、どのようなことができるようになったのか
不気味の谷を越えたことにより、今までよりも優れた感情表現を表す事ができるようになった。リップシンク以外も生成できるので、怒り、悲しみ、喜びなどの感情表現や快・不快などの表現を提示できるようになりました。


■動画がリアルになったことで、どのようなシチュエーションでの活用を見込めるか
・アイドルのファンクラブなどで身代わりとなり対応してくれる。
・カーナビゲーションのエージェント
・アナウンサーの代わり
・企業受付の代わり
などなど 枚挙に暇がないほどとなっております。




▲DeepAICopyのデモ動画


【開発背景】

近い将来、医療や介護現場、オフィス、工場などにおけるAIの活用が期待されています。現に将棋やクイズなどでAIが人間に勝利した事例も報告されており、私達よりも高度で複雑な計算処理を行う
ことができるようになりました。一方で、AIはまだ人間と同様に仕事をしたり、生活をすることはできません。AIがより人間のような存在になっていくことは可能なのでしょうか。
その問いへのアプローチとして、より人間らしい振る舞い、より人間らしい会話を実現するAIの研究開発をスタートさせ、「DeepAICopy」のリリースに至りました。


【アプリケーション概要】

事前に発話中の人の顔を約40分間収録した動画・音声をAIに学習させることによって、その人が発話しているような口の動きの画像、音声を人工的に合成し、Zoomアプリでリアルタイムで会話・返答するオリジナルのAIを作成します。

Zoomアプリでは、ルームメンバーにいるオリジナルAIに話しかけると、AIがトークの文脈を認識して、適切な返答をしてくれます。現在は、下記トーク機能を搭載しており、今後さらに機能が追加される予定です。

■FAQ機能
予め登録しておいた情報の通りに返答する機能です。外見だけでなく音声もそっくりに合成して再生されます。例えば次のようなパーソナルな項目に対して、答えをひも付けておくこともできます。

名前、特技、夢、好きな食べ物、明日の天気、合言葉、道順、ログイン方法 e.t.c...

■フリートーク機能
AIと自由に日常会話ができる機能です。「こんにちは」「今日は暑いね」など、なにげない言葉に対して、返答をしてくれます。

「DeepAICopy」に関する詳細は、以下URLをご覧ください。
http://www.deepcopy.jp/


【利用シーン】
「DeepAICopy」は、現在はZoomアプリで利用可能ですが、近日ウェブアプリケーションのリリースも、予定しているため、ラップトップや携帯端末、パプリックディスプレイなどあらゆる場所で利用可能となります。
例えば、オフィスなどの受付案内や芸能人のファンクラブ限定コンテンツ、ウェブニュースのキャスターにAIを搭載したり、あまり会えない家族の代わりにAIと食卓を囲むということもできるようになるでしょう。



▲DeepAICopyの可能性


【技術について】

これまでの生成系GANでは数十秒かかっていた事を、独自アルゴリズムとNvidiaのテクノロジーとの融合、高速化アルゴリズム学習などを駆使いたしまして、返答時間を大幅にアップしました。


【ご利用に向けて】

現在、本アプリケーションは、ご利用のお申し込みを承ってから開発をしております。
開発納期や価格、学習用の動画撮影方法、技術の詳細など、サービスのご利用方法については、下記フォームよりお問い合わせください。
https://form.run/@DeepAICopy


【今後の展開】

■個人の趣味、嗜好をAI再現
それぞれの人の声や表情、物に対しての快/不快などの感情をひも付け、趣味・嗜好の違いを学習させることによって、人の個性を再現したAIをつくりだす機能を追加予定です。

■意識を持たせる
周りからしてくる音や人々の話している内容、風景や人々の動作などの情報から、その文脈や関係・関連を踏まえて表情を変えたり発言したりする機能を追加予定です。
例えば、大勢の人を感知し、更に大音量の音楽が聞こえてきた際には「ここはライブ会場ですね」とつぶやく、といった自律的な思考・行動が実現できます。

■会議でのファシリテーション
オンラインミーティングにおける司会やタイムキーパー、議事録係(テキストログを生成)をする機能を追加予定です。

その他にも、弊社では複数の特許技術で、従来のAIを超えたコミュニケーションを可能にさせる取り組みを進めております。


【会社情報】

クリスタルメソッド株式会社について
約10年、人工知能の研究開発や導入支援を行い、複数の特許取得実績があるAI専門企業です。自社開発の対話型AI HAL3には、人の感情を理解する「好感度推定」や「感情表現付き読み上げ」機能を用い、医療・介護・オフィス分野での貢献が期待されています。「仕方ないからAIに・・・」ではなく、AI研究を通して未来へ社会貢献が行えるよう、日々研究開発を積み重ねています。
クリスタルメソッドに関する詳細は、http://crystal-method.com/ をご覧ください。


本リリースに関するお問い合わせ先
クリスタルメソッド株式会社 担当:河合・竹腰
MAIL:info@crystal-method.com TEL:03-6265-4755


  • IT、通信、コンピュータ技術

会社概要

商号
クリスタルメソッド株式会社(クリスタルメソッドカブシキカイシャ)
代表者
河合 継(カワイ ケイ)
所在地
〒102-0073
東京都千代田区九段北4-1-14九段北TLビル 5F 
TEL
03-6265-4755
業種
ソフトウエア
上場先
未上場

運営会社 プライバシーポリシー情報削除ガイドラインサイトのご利用についてサイトマップお問い合わせ

© 2007-2020 GlobalIndex Co.,Ltd. All Rights Reserved.