音声認識を用いた学会講演における情報保障(字幕付与)の試験運用を開始しました。(2015年8月22日)

ターゲット
公開日

本学で研究開発されてきた音声認識システムを用いた字幕付与(情報保障)の試験運用を、情報処理学会のアクセシビリティ研究グループ(SIG-AAC)の発足に際して、聴覚障害者を対象として開始しました。講演者の音声を高い精度で文字化する音声認識システムの学会における継続的な運用は前例がなく、複数の熟練者による連係タイプ入力と比べて、大幅に低いコストで情報保障の提供が期待されます。

2016年度(平成28年度)から施行される障害者差別解消法では、障害者に「合理的配慮」を行うことが義務づけられています。大学等に在籍する障害学生数は年々増加しており、講義や学会等の講演会で情報保障を提供することが要請されています。聴覚障害者に対しては、要約筆記・字幕付与を行うことがこれに該当しますが、専門性の高い講演・講義の内容をリアルタイムに文字化できる人員(パソコン要約筆記者)は限られていて、各大学等ではその養成が課題となっています。

河原達也 情報学研究科教授および秋田祐哉 経済学研究科講師らは、自然な話し言葉を対象とした音声認識の研究を行っており、講演・講義に字幕付与を行うシステムを開発しました。講演者には、事前に予稿を提出してもらい、音声認識システムをその話題や語彙に特化させることで精度を高めます。また音声認識は完全でなく、誤りを修正する人員が必要となりますが、精度が高い場合には1名でもできます。パソコン要約筆記者と比べて経費もおおむね10分の1以下で済むと期待されます。

講演者には、事前に予稿を提出してもらう、丁寧にゆっくり発声してもらう、質疑では質問を復唱してもらうなどの協力をしてもらう必要がありますが、本システムを継続的に運用することで、精度を高め、運用のノウハウも蓄積していく予定です。

概念図

システムの実演の様子

関連リンク

関連部局