ワンストップモチーフ解析のためのタンパク質-遺伝子モチーフ辞書システムの開発
Development of a Protein-Gene Motif Dictionary System for One-Stop Motif Analysis

概要

タンパク質アミノ酸配列はその構造や機能と密接に関係している。特に機能と密接に関係する局所構造特徴をモチーフと呼び、それは遺伝子にもよく保存されている。生体高分子データは急速に増加し、未知データの構造や機能を効率的に解析するためのデータベース構築が切望される。ここで、私たちはいくつかのモデル生物種を対象としたNoSQLによるタンパク質-遺伝子モチーフ辞書システムを構築した。この辞書にはPROSITEによるタンパク質配列モチーフとそれに対応するmRNA配列、そして関連するタンパク質立体構造を収録されている。7種のモデル生物種の49,265エントリに対して、120,047配列モチーフと57,452構造モチーフ収録できた。また、ユーザーが辞書システムを直感的に扱いやすいようGUIシステムも開発した。モチーフの共起解析を行い、zinc proteaseモチーフとcysteine switchモチーフの配列距離は117から293残基と幅が存在するが立体構造距離は約12Åで保存されていることを発見した。

産業界への展開例・適用分野

タンパク質工学、創薬、バイオインフォマティクス

研究者

氏名 専攻 研究室 役職/学年
大友将宏 知能情報学専攻 数理生物情報研究領域 博士3回生
加藤博明 その他の専攻・大学 教授

Web Site

https://sunflower.kuicr.kyoto-u.ac.jp/~ohtomo/ProteinGeneMotifDictionary