目次

研究テーマ

Computational Systems Biologyが研究テーマです.「次世代生命体統合シミュレーションソフトウェアの研究開発」「ゲノムネットワークプロジェクト」などに参画し,情報科学と生命科学が融合している研究室です.

生命システムのシミュレーションソフトウェアの研究

(旧ページ) (製品ページ)

Cell Illustrator (セルイラストレータ) は、本格的なシステム生物学のためのソフトウェアです。生命システムを構成する複雑なパスウェイ (代謝経路、遺伝子制御ネットワーク、シグナル伝達経路、細胞間の制御反応など) のモデルを コンピュータ上で絵を描くように作成できます。そしてこの絵描きの操作だけでシミュレーションまでできてしまうという強力なツールになっています。

これまでのシステム生物学のソフトウェアには、とっつきにくい、難しい、関係ないという印象が先行していました。しかし、セルイラスト レータは、「生物系の研究室で実験をするかたわら、パスウェイの情報を知識整理し、その知識整理したモデルをシミュレーションすることで次の実験に何をす るかを決められる電子ラボノートブック」として利用されることを目標として開発されています。そのため、システム生物学という言葉に興味を持ったのなら ば、最初に自信をもっておすすめしたいソフトウェアです。誰もが少ない準備ですぐに利用できるはずです。

セルイラストレータは簡単に使えるソフトウェアですが、実をいうとペトリネットという制御理論の体系に裏打ちされており、とても複雑なモデルまで作成できます。ぜひ、http://www.cellillustrator.com/ の デモをご覧ください。

セルイラストレータを使うために必要なスキルは以下の3つです。

  1. 生物への興味
  2. 携帯電話の操作が普通にできるくらいの電気機器を扱う能力
  3. 中学3年生までにならう数学の学力

セルイラストレータオンライン (Cell Illustrator Online)

(アカデミック利用のサイト) (製品ページ in BIOBASE)

セルイラストレータのオンライン版です。本ソフトウェアは、インターネット経由で起動するオンラインアプリケーションであるという特性を生かし、常にアップデートされた最新のセルイラストレータを使用できます。また、インターネットに接続されていることを前提にした多くの拡張機能を利用できます。

セルイラストレータオンラインは、モジュール追加の機能を持ち、ユーザは必要な機能を選択して追加できます。このオンラインバージョンでは、パスウエイデータベース検索モジュールを標準で搭載しています。このモジュールを用いることで、 CSML 形式に変換したバイオベース社のパスウェイデータベース TRANSPATH を検索し、その結果をセルイラストレータのキャンバスに高品質のレイアウトとともにインポート・表示できます (下図左)。また、タンパク質や mRNA などの各コンポーネントには、ユニークな絵が追加され、セルイラストレータの標準的なモデルとおなじように編集・シミュレーションできます (下図右)。

ユーザ登録することで、 1 か月間セルイラストレータオンラインを利用できます。また、セルイラストレータプレイヤはユーザ登録することなく利用することができます。http://cionline.hgc.jp/

Cell System Markup Language (CSML)

CSML (Cell System Markup Language) は、細胞内の遺伝子制御ネットワーク、代謝ネットワーク、シグナル伝達系、細胞間の制御関係などを、システムダイナミクスを含めて記述するための XML フォーマットです。他の生体内パスウェイ記述 XML フォーマットである CellML や SBML 形式を包含できるよう定義されています。さらに、より厳密かつ効率的に他形式とのデータのやりとりを実現するため、 CSML は OWL で記述したオントロジー言語 CSO (Cell System Ontology) を利用して定義しています。 CSO は、シグナル伝達経路や遺伝子制御ネットワークをダイナミクスを含めて知識表現するにおいて必須と考えられる語彙を定義しています。さらに、さまざまなアプリケーション間で視覚情報も標準化して相互にやりとりできるようにするため、 CSO では各語彙に対して標準のアイコンを定義しています。

遺伝子ネットワーク推定とその応用技術の研究

マイクロレイを用いて得られる遺伝子発現データなどを用いて,薬剤標的遺伝子の探索や病気や薬剤応答に関する遺伝子ネットワーク探索の研究です.

遺伝子発現データのクラスタリング

本研究室では,階層型クラスタリング,k-means,SOM のためのオープンソースライブラリ C-clustering library を開発しています.このライブラリは NCBI において正式に用いられています.また,確率モデルに基づくクラスタリングのための Mixed Factors Analysis という方法を開発し,ArrayCluster というソフトとして公開しています.

遺伝子制御ネットワークの推定

GeneChipなどにより計測された遺伝子発現データに基づき,遺伝子制御ネットワークを予測する研究を行っています.我々の研究室では,ベイジアンネットワーク,Lasso回帰モデル,状態空間モデルなどの既存の統計モデルを基に,生命科学分野のデータにより適用した新たな統計モデルを構築し,それらを基盤としてスーパーコンピュータの利用を前提とした大規模遺伝子制御ネットワーク推定における新たな計算機科学的方法論の構築を行っています.開発した遺伝子制御ネットワーク推定手法を用い,新たな薬剤標的遺伝子の発見を目指した研究を行います.

エクソンアレイデータの解析

エクソンアレイデータとは,超高密度マイクロアレイにより計測された約100万個のエクソンの発現データです.この大規模データを解析するには通常の個人向けコンピュータでは十分ではありません.我々の研究室では,エクソンアレイデータから疾患に関連する異常選択的スプライシングを発見するため統計科学的方法論を確立し,それをウェッブサービス ExonMiner として公開しています.このウェッブサービスは,東京大学医科学研究所ヒトゲノム解析センターのスーパーコンピュータシステム上で稼働しています.

遺伝子機能の統計関連解析

ある遺伝子群に有意に多く含まれる遺伝子機能を統計的に判定するための方法としては,GO::TermFinder が良く用いられます.また,この目的のためには数多くのソフトウェア,ウェッブサービスが公開されています.しかしながら,既存の方法は例えば統計的仮説検定により得られた各遺伝子のp-値を基に付けられた遺伝子の順位情報だけを用いて遺伝子機能の有意性判定しています.この順位情報による相対評価の問題点を明らかにし,それを解決した方法論を我々の研究室では確立しました.この方法論は MetaGP というウェッブサービスとして公開予定です.

生命システムデータ同化技術の研究

データ同化は観測データとシミュレーションモデルを融合する新たな研究手段として地球科学の分野で世界的な注目を集めている第4の科学です.これを生命システムに応用する研究です.