テキストアナリティクスツールは人文情報学において,文書の統計的性質を調べるために広く利用されている他,企業での活用事例も多い.しかしながら,これらの現場のうちに必ずしも統計学の専門家がいるとは限らず,分析手法の説明の正確性や網羅性,再現性に欠けることがある.本研究では,こうした非専門家による利用を念頭に置き,テキストアナリティクスツールのログと説明文の間の新しい変換モデルを提案する.また,テキストアナリティクス分野におけるこのような変換は先行研究が少ないため,いまだ豊富な学習データが得られているとは言えず,学習データの拡充は急務である.そこで,学習データの構成要素であるログおよび説明文を収集するためのシステムについて開発し,公開した.
テキストアナリティクスツールの利用拡大,分析結果執筆のサポート,分析の再現
氏名 | コース | 研究室 | 役職/学年 |
---|---|---|---|
仲田将斗 | 学術情報メディアセンター | 大規模テキストアーカイブ研究分野 | 修士1回生 |
亀甲博貴 | 学術情報メディアセンター | 大規模テキストアーカイブ研究分野 | 助教 |
森信介 | 学術情報メディアセンター | 大規模テキストアーカイブ研究分野 | 教授 |