大規模語彙意味辞書に基づく実テキスト解析
Real Text Analysis based on a Large-scale Lexico-semantic Dictionary
概要
我々は、実テキストを頑健に解析することを目的として、国語辞典やWikipedia、大規模Webテキストなどから語彙に関する文法的・意味的な知識を獲得し、それらの知識を統合的に扱う枠組みを構築している。この枠組みにより、テキスト中に出現する語彙の知識を高次の解析において利用することが容易になる。本展示では、上記の枠組みに基づく実テキスト解析のデモンストレーションを行う。
産業界への展開例・適用分野
ブログやtwitterなどのCGMの実テキストには、既存の言語解析システムの辞書にない固有名詞や新語が多く含まれており、そのような語によってテキストの単語分割および後続する言語解析に誤りが生じる。本研究で獲得した語彙知識により、言語解析の誤りを軽減でき、さらに語に対して意味的な知識を付与することで、情報検索や評判分析などの言語処理アプリケーションに役立てることができる。
研究者
氏名 | 専攻 | 研究室 | 役職/学年 |
---|---|---|---|
進 義治 | 知能情報学専攻 | 黒橋・河原研究室 | 修士1回生 |
柴田 知秀 | 知能情報学専攻 | 黒橋・河原研究室 | 助教 |
村脇 有吾 | 知能情報学専攻 | 黒橋・河原研究室 | 特定助教 |
河原 大輔 | 知能情報学専攻 | 黒橋・河原研究室 | 准教授 |
黒橋 禎夫 | 知能情報学専攻 | 黒橋・河原研究室 | 教授 |