研究内容

線虫における発生動態の解明(CRESTプロジェクト)

研究概要

理化学研究所、京都大学医学研究科との共同プロジェクトにおいて線虫をモデル系として使用し、多細胞生物の発生のメカニズムを解明するデータ駆動型の研究手法の開発を目指して研究を行っています。

近年の急速な技術発展により、生命科学分野では様々な遺伝子を不活化した条件で細胞や個体の動態を時空間計測したデータの蓄積が急速に進んでいます。これらのデータを解析することにより、個体発生の途中で発現する様々な形態的/生化学的特徴の因果関係の導出や、その因果関係のメカニズムに関与する遺伝子群の導出など、個体発生のシステムレベルでの解析が可能になってきつつあります。データ駆動型の研究手法は、21世紀の生命科学の主要な推進力となると期待されています。このプロジェクトでは将来哺乳類やヒト幹細胞の発生・再生研究における主要な研究戦略の一つとなることが期待されているデータ駆動型研究の研究手法を先行的に開発、ビッグデータ向け可視化技術によりパラダイムシフトに資する科学的発見を促す環境の構築を目指しています。

上記の実現のため、研究室では『基礎生命科学ビッグデータを用いて行われる科学的方法において重要な因果関係の発見を支援するための視覚的分析環境を構築』を目指して研究を実施しています。

ウェットのみならずドライ環境において取得されたビッグデータから作成された因果グラフにおいて潜在変数の発見を促進する粗視化技術の研究開発を行います。粗視化は、あるユニット中のスカラ量の平均を取り、その平均値でユニットの詳細度を制御することを意味します。スカラ量は、統計解析結果であることが多く、たとえばここでは統計解析技術を利活用しています。本来、生命現象は階層的な構成であることが多く、粗視化は本来生物の解析には適切な手法です。生物学者が線虫胚発生の全体像の解明を支援するために、粗視化によって得られた複数の階層(レイヤー)をインタラクティブに操作を行うための環境を構築していきます。

ビッグデータを用いたデータ駆動モデリングや生化学ネットワークと形質発現ネットワークの統合分析を支援するために、配列空間・実体空間などの表示空間の切り替え、可視化対象区間の変更などをインタラクティブに実現するための環境を構築します。フランスのルイ・パスツールの言葉(1854年のリール大学学長就任演説より)を借りるならば、科学的発見は「構えのある心」(the prepared mind)にしか恵まれません。この言葉が表すセレンディピティ豊かな研究環境を情報科学の力で実現することを目指しています。

さらには、細胞におけるマイクロRNAの空間密度と関連する分子の空間密度の相関から因果関係を探索するための可視化技術をデザインします。

研究業績

表現型特徴の因果関係ネットワークのように辺数が多い密グラフの視認性を高めるために、密グラフを可視化した場合の辺交差を削減する新たな辺集中化アルゴリズムを開発し、表現型特徴の因果関係ネットワークの辺交差を53%削減することに成功しました。

成果の詳細

表現型特徴因果関係ネットワークをわかりやすく可視化することは、そこからの新たな知識の発見を促進する上で必要不可欠です。時間変化する特徴量間の因果関係を可視化するために階層グラフレイアウトの適用が考えられますが、この因果関係ネットワークは辺の数が多い密グラフであるため、これを階層グラフレイアウトによって可視化した場合に多くの辺交差が現れます。辺交差の発生は、可視化結果の美しさを損なうだけでなく、可視化結果の読み取りに悪影響を与えることが知られています。そのため、密な階層グラフに現れる辺交差を取り除き、視認性の高い可視化結果を生成することが課題でした。

図1 表現型特徴因果関係ネットワークの階層グラフレイアウトによる可視化結果

(左:辺集中化適用前、右:辺集中化適用後)

われわれは、このような辺交差を取り除く方法として辺集中化(Edge Concentration)に着目しました。辺集中化は、階層グラフに含まれるバイクリーク(完全二部部分グラフ)を抽出し、集中化ノードを用いて置き換えることで辺交差の除去を行います。しかし、既存の辺集中化アルゴリズムでは、表現型特徴因果関係ネットワークのような大規模なグラフにおいて辺交差の除去を十分に達成することができませんでした。そのため、辺集中化後の辺数の最小化に基づいた新たな辺集中化アルゴリズムを開発し1)、表現型特徴因果関係ネットワークへの適用を行いました。提案手法は既存手法と比較して、大規模なグラフに対しても効果的に辺交差の除去を行うことができ、また、計算時間の観点でも優れています。図1は表現型特徴因果関係ネットワークの可視化結果を表しており、左は辺集中化適用前、右は辺集中化適用後の結果の図です。辺集中化適用前の辺交差数が8663であるのに対して、辺集中化後の辺交差数は4035であり、およそ53パーセントの辺交差の除去が達成できました。本手法は、グラフドローイング分野への顕著な貢献が認められ、IEEE Transactions on Visualization and Computer Graphicsに論文が掲載されました。

細胞におけるmRNAや関連する分子の空間密度の相関から因果関係を探索するために細胞内流れ場に沿ったデータ分析が重要です。このために、われわれは、流れ場からの流跡線を抽出し、そのうえでスカラデータをサンプリングし、それらを使ったモデル作成を支援するシステムの開発を行いました。また、分析対象の複数の密度場を、融合しつつもわかりやすく可視化するために、表現力・拡張性に優れた粒子レンダリング技術の高速化技法を開発しました。具体的には、粒子の半径を利用者が付与する不透明度に応じて適切に変更するためのアルゴリズムを開発しました。

PAGE TOP

俯瞰的可視化

因果関係可視化