人の話し方や表情を撮影した動画を評価して可視化する、 エフィシエントが特許取得・・・「話し方」の改善を支援

株式会社エフィシエント(本社:横浜市西区 代表取締役社長:脇坂健一郎)は、AIによる話し方解析スマホアプリ「Steach」を開発するなかで、動画を複数の第三者が評価した結果を可視化する特許を取得したと、21年12月17日次のように伝えている。

Steachは、話している様子をスマホやPCで撮影すると、AIによって撮影された動画を解析、評価することができるアプリケーションで、その客観的な評価で、「話し方」の効率的な改善を支援するもの。

特許取得にあたって、Steachは、ユーザがスマホで撮影した動画をwebで閲覧することができ、機械学習によって撮影された動画は解析されて定量化される。しかし、動画では話し方や表情が時系列で変化していき、そのため平均的な評価(統計的な評価)よりも、人に近い感覚での評価が必要になると考えて、AIの解析手法であるディープラーニングを使った解析ができるように開発を進めてきた。

このディープラーニングによる解析エンジンを完成させるためには、AIエンジンに学習をさせるための教師データを作成する必要があり、その教師データを作成する仕組みを構築していく中で特許の仕組みを構築したもので、その特徴は、

・ユーザの話し方や表情に対する評価に関する情報を複数の第三者が評価(タグ付け)した結果を可視化(ヒストグラム表示)することができる機能
・表示されたヒストグラムをクリックするとクリックした時刻で動画を再生する
・再生中の時点に対応するヒストグラムの柱を強調表示する
・高評価タグに対応するヒストグラムの柱と、低評価タグに対応するヒストグラムの柱とを異なる
示形態で積層表示する

となっている。

エフィシエントでは取得した特許は、人の話し方や表情を複数の第三者が評価して可視化することが可能となり、そのため学習用動画教材や企業向け研修動画などを視聴者が見て、わかりやすい、わかりにくいなどの評価を行うことが可能となったり、企業の採用活動で動画を提出させるケースで複数人が同じ動画の評価を行ったりと多様な利用が可能と考えているとしている。

今回取得した特許(特許番号:特許6978815)の文献表示の【要約】は
【課題】ユーザの話し方や表情の変化に伴う評価の時系列変化をユーザに把握させること。

【解決手段】情報処理システムは、記憶部と制御部とを有する。上記記憶部は、第1ユーザが話している様子を撮影した動画データと、当該動画データのいずれかの再生時点に付加された、上記第1ユーザの話し方または表情に対する肯定的な評価を示す高評価タグに関する情報を含むタグ情報とを記憶する。

上記制御部は、上記タグ情報を基に、横軸に上記動画データの再生時間帯を示し、縦軸に当該再生時間帯毎の上記高評価タグの数を示すヒストグラムを生成し、当該ヒストグラムを上記動画データの再生画面と共に出力する。上記高評価タグは、複数の第2ユーザのユーザ端末上で再生中の上記動画データのいずれかの再生時点で各第2ユーザにより所定の第1操作が入力されることで付加される。


【オリジナル記事・引用元・参照】
https://prtimes.jp/main/html/rd/p/000000005.000069602.html
https://www.j-platpat.inpit.go.jp/p0200
https://steach.app/

* AIトピックでは、知的財産に関する最新のトピック情報をAIにより要約し、さらに+VISION編集部の編集を経て掲載しています。