データ駆動型科学を推進する大規模ネットワークの可視化と分析
Visual Analytics for Large Scale Networks to Drive Data-Driven Science

概要

様々なビッグデータ・異種のデータを可視化しデータ解釈を促進するアプローチを研究しています。

生命科学の分野では、細胞内のすべてのmRNAやタンパク質、代謝物の発現量や、タンパク質間相互作用など、生体分子についての大規模なデータが公開されています。またこれまでハイスループットな計測が難しかった形質(形や行動様式)にかかわる表現型特徴もバイオイメージインフォマティクスにより可能となってきました。

生物学において遺伝子やタンパク質、表現型特徴など異なる階層の情報をまるごと理解することが生物の理解につながると期待されていますが、単にデータを紐付けるだけでなく、複雑な遺伝子や表現型特徴をわかりやすく可視化し、階層横断的に探索できる仕組みは、これまで頭の中で閉じていた研究者の思考を表出させ、研究プロセスを促進させます。

そこで私たちは、線虫の大規模な表現型特徴データベースを有する理化学研究所のチームと共同して、表現型特徴—遺伝子ネットワークの横断的探索を支援するビジュアル分析システム「PheGeNet」を開発しています。図に示すように、遺伝子ネットワーク(左)と表現型特徴ネットワーク(右)を同時に可視化し、遺伝子のノックダウン(RNAi)により変化する表現型特徴関係をもとに2つのネットワークを結び付けることにより、どの遺伝子がどの表現型に効き、どの表現型がどの遺伝子に関連するのかを調べることができます。さらに生物学的データベースや論文情報などをシステム上で参照可能であり、様々な思考実験をデータドリブンに行うことのできるワークスペースをWeb 上に構築しています。

本出展ではPheGeNetを含め、これまでに開発した様々なデータ可視化のWebアプリケーションを紹介します。

産業界への展開例・適用分野

ネットワーク構造を持つ大規模なデータや異種なデータを可視化を介して連結し分析することは、産業界においてデータ駆動的に現象を追求し、産業界の活動へ生かすことができる重要なアプローチです。インタラクティブな情報可視化ツールはますます重要性を増しているが、その中でもデータや機能、ユーザのタスクなどを抽象化できれば、多くの分野に展開することが可能になると考えています。

研究者

氏名 専攻 研究室 役職/学年
夏川 浩明 学術情報メディアセンター 小山田研究室 特定講師
王 婷 その他の専攻・大学 小山田研究室 博士2回生
小山田 耕二 学術情報メディアセンター 小山田研究室 教授

Web Site

https://natsukawa-lab.jp/