本研究では、悪口などの攻撃的な発話が本気(暴言)であるか冗談であるかを識別する手法を開発した。
まず、7199個の不快な内容の発話に対しそれが冗談であるか本気であるかの4段階のレベルをラベルとして付け、データセットを作成した。次に、息もれ声(breathy voice)ときしみ声(creaky voice, vocal fry)、緊張した音声(pressed voice)に関連する声質特徴を音声から抽出して従来の韻律特徴と組み合わせ、それを入力として冗談レベルを推定するニューラルネットワークアーキテクチャを開発した。そして、提案した認識器の性能を、音声感情認識のためのニューラルネットワークを使用した標準的な手法と比較した。その結果、提案手法が最も高い精度で暴言と冗談を識別した。
ヒューマンロボットインタラクション(HRI)、音声対話システム等
氏名 | 専攻 | 研究室 | 役職/学年 |
---|---|---|---|
前濵孝太 | 社会情報学専攻 | 神田研究室 | 修士1回生 |
Jani EVEN | 社会情報学専攻 | 神田研究室 | 特定講師 |
神田崇行 | 社会情報学専攻 | 神田研究室 | 教授 |