実験設定を適切に記述することは、科学技術論文において重要である。本研究では、テキストマイニングツールのログから実験設定の説明文を生成することを目的とする。人文科学分野において広く使用されている KH Coder を用いている論文を対象に収集し、論文中の実験設定の記述と実際のツールの実行ログを再現したもののペアからなるデータセットを構築した。また、このデータセットを用いて論文中の記述から実行ログを推定するモデルを構築し、アノテーションしていない論文に適用することにより自動的にデータセットを拡充した。これらを用いて,実験ログから説明文を生成するモデルを構築した。
テキストマイニングツールの実サービス上での展開が考えられる。
氏名 | 専攻 | 研究室 | 役職/学年 |
---|---|---|---|
森田 康介 | 知能情報学専攻 | テキストメディア分野 | 修士2回生 |
西村 太一 | 知能情報学専攻 | テキストメディア分野 | 博士3回生 |
亀甲 博貴 | 知能情報学専攻 | テキストメディア分野 | 助教 |
森 信介 | 知能情報学専攻 | テキストメディア分野 | 教授 |