株式会社ディー・エヌ・エー(本社:東京都渋谷区、代表取締役社長兼CEO:岡村 信悟、以下 DeNA)は、セコム株式会社(本社:東京都渋谷区、代表取締役社長:尾関 一郎)が販売を開始した「バーチャル警備システム」(URL: https://www.secom.co.jp/corporate/release/2021/nr_20220113.html )において、クラウドシステムを共同開発し、AIを活用した音声合成技術・キャラクターの提供をおこないました。
「バーチャル警備システム」は、現実空間を映しこむディスプレイ一体型ミラー上に3Dモデルとして表示したバーチャルキャラクター「バーチャル警備員」が常駐警備サービスを提供するセキュリティシステムです。AIを活用した警戒監視や受付業務などを「バーチャル警備員」が提供、対処や緊急対応などの業務は熟練した常駐警備員が提供します。また、クラウド制御により、どこからでもモニタリングや設定操作が可能です。
DeNAは、「バーチャル警備システム」の管理システムをセコムと共同開発しています。管理システムをクラウド化することで遠隔での監視や設定更新が可能となっております。また、「バーチャル警備員」のキャラクターデザインの原案、及び音声合成技術を提供しています。音声合成技術では、音声合成モデルに系列データを考慮した、再帰型ニューラルネットワークを用いたことで、実際に人間が語りかけているような自然な音声の合成に成功しました。また、任意のテキストを音声化できる高い拡張性をも有しています。これらの技術により、「バーチャル警備員」による受け応えがスムーズになり警備業務の負荷軽減につながり、また拡張することで受付業務の代替など幅広い機能に対応をすることが可能となります。
音声合成技術について
●音声合成とは
・テキストから音声を合成する技術
・音声をテキストに変換する「音声認識」とは逆の技術
・カーナビ、駅の構内放送、スマホの音声アシスタントなどで広く使われている
●「バーチャル警備システム」の音声合成開発
⑴ テキスト解析過程
・日本語の様々な単語の読みやアクセントが集約されたオープンソースの言語辞書をベースに、人名や固有名詞をより正しく読めるように登録
⑵ 音声生成過程
・警備の利用シーンを想定した大量の台本を作成
例)「いらっしゃいませ、どうなさいましたか?」
・警備キャラクターのイメージに合った声優を選定
・ゲームやアニメにおける知見やノウハウを活用し、スムーズで高品質な音声収録を実現
●「バーチャル警備システム」の音声合成技術の特長
・深層学習の導入により、実際に語りかけているような自然な音声を合成可能
・今後は任意のテキストがあれば音声化できるため、高い拡張性を実現
・DeNAに所属する、音声合成技術とアニメ映像に携わるそれぞれのプロフェッショナルが集合した合同チームによる開発
クラウドシステムについて
●モニタリングダッシュボード(監視用アプリ)
・クラウド経由で「バーチャル警備員」の動きやログ、周辺のカメラ映像の確認が可能
・来訪者を検知したなど特定イベントが発生した場合に音と合わせて通知を鳴らす
・「バーチャル警備員」による自律応答が難しい場合やきめ細やかな対応が必要な時には、遠隔で通話して応対したり、「バーチャル警備員」の操作をすることが可能
●各種設定
・設置場所ごとにカスタマイズ設定した「バーチャル警備員」を動作させることが可能
・管理システムをクラウド化したことにより、「バーチャル警備員」の対話シナリオや案内地図など、各種設定の更新がいつでも容易に可能
キャラクターデザイン(原案)について
●「バーチャル警備システム」のキャラクターデザイン
・セコムより警備そのものの理念や警備員としての姿に関するレクチャーいただいた上で、ふさわしいキャラクターを設定
・デザイン原案は、DeNAでゲームやエンターテインメント事業を手がけるスタッフが制作
・実物の警備員との大きな差分がないこと、一方で親しみやすさを出すようにキャラクターとしての微妙なバランスを意識した
DeNAは、これまでのゲーム事業などで培ってきたエンターテインメントのノウハウと、AIの研究開発部門で磨かれた技術を活用し、エンタ―テインメントとAIという異なる領域を融合させる形で「バーチャル警備システム」に参画しています。
参照元:PRESS CUBE