つなぎ、導くPReMo

2016年4月26日

タンパク質の精製や結晶化の条件探しが、構造生物学にとってボトルネックとなっている今、ビッグデータを活用することで活路を見出そうとしている。

こうしたことを狙って動き始めているのがPReMo(プレモ、Photon Factory(PF) Remote Monitoring System)。元来、PFで行われる実験の様子を外からモニターするために開発されたシステム。PReMoは測定結果を管理するデータベースでもあり、国内外の研究者が集うPFには、膨大なデータが蓄積される。ここにビッグデータの解析が加わることで、新たな研究の形を作ろうとしている。

放射光の登場により、「生物学」は細胞を構成するタンパク質の構造から機能を理解する「構造生物学」へと発展した。タンパク質の機能を解明していくことは、生命活動のしくみを解明することであり、学術的な意義に加え、病気の解明や治療薬の開発につながるとして製薬企業の多くが放射光を使うようになった。

タンパク質結晶構造解析の一般的な流れは次の通り。①大腸菌などを利用して、目的のタンパク質を大量に作る。②タンパク質を精製、集めた溶液から結晶を作る。③放射光をあて回折データを得る。④データ解析し、立体構造を得る。創薬研究の場合、これに加え薬の元となる様々な化合物との結合などをみるため、サンプル数が膨大になる。

大腸菌などを利用して、目的のタンパク質を合成。

タンパク質を精製、結晶化条件を探る。

ドロップの中に結晶ができたら、、、

結晶をループですくって、

X線照射して回折データを取る。

回折データから電子密度図を構成し、分子構造が分かる。

PFのような放射光実験施設で行われるのは③と④。実験者はとにかくたくさんのサンプルを用意して、次々とデータを取っていく。立体構造を得るには、結晶を0.5~2度刻みで回転させながら、半周180度相当のデータを撮影する。その数、一日当たり100~300セット。実験者にはビームタイムという放射光を利用できる時間が配分されており、時間内に出来るだけ多くのデータを取り、持ち帰ってデータを解析する。放射光実験で得られるのは、無数の回折点が記録された回折イメージ。そこから回折強度データを抽出する際の統計情報から、結晶性の良し悪しを判断し、構造解析に適したサンプルを選定する。そして回折強度データからタンパク質の電子密度分布を構成し、そこに分子構造をあてはめることで全体の立体構造を作り上げていく。

放射光ビームラインでは、実験室で使われるX線発生装置を凌駕する性能のX線ビームや、整備の行き届いた高性能実験装置を利用することができ、これらはタ ンパク質結晶構造解析を行う上で必要不可欠なものとなっている。PReMoは、PFにある全てのタンパク質結晶構造解析ビームラインに備えられ、回折実験 の条件や、得られた回折イメージなどを記録しインターネット経由で世界中どこからでも閲覧可能にしている。さらに回折イメージを処理して回折強度データを 得る工程もPReMoが自動で行い、統計情報から得られるデータの質までもデータベースに記録される。これは得られたデータが後の構造解析に向くものかど うかを客観的に評価する手助けになり、実験そのものを効率化させる。

結晶化の壁
構造生物学の分野では、これまでタンパク3000(2002~2006年)や、ターゲットタンパク研究プログラム(2007~2011年)といった大きなプロジェクトが次々と進められてきた。これにより、放射光ビームラインが整備されビーム性能や実験装置が充実してきた。またそれに伴い、タンパク質の構造は次々と解かれ、研究対象が結晶化し易い単純なタンパク質から、結晶化が困難で手が付けられなかった複雑なタンパク質へと移行してきている。必然、実験の進め方も変わってきている。これまでは、X線発生装置で結晶の質を事前にチェックして、適したものだけを放射光ビームラインに持ちこみ測定していた。複雑なタンパク質になると、結晶が微小であったり不完全であったりしてX線発生装置では全く測定することが出来ず、結晶の良し悪しから放射光で判断する必要がある。今後は、さらに遡ってサンプルが結晶化に適した均一な状態かを放射光を利用した溶液散乱で調べたり、結晶化の条件を大規模に探ることも放射光施設で行うようになると考えている。

PReMo×ビッグデータ
そこで重要となってくるのが、サンプルごとにIDを割り付けた実験データ管理。タンパク質精製の条件、結晶化のための溶液の条件、溶液散乱、結晶の状態、測定環境、どこをとっても生い立ちを辿ることができ、どの過程にもフィードバックを正確に迅速に出来る必要がある。PReMoの本当の狙いは、データベース化による新しい研究の進め方だ。そのために、結晶化ロボットのデータベース化(PXS-PReMo)、溶液散乱のデータベース(SAXS-PReMo)との統合に現在取り組んでいる。

「このシステムは、これからの放射光実験の屋台骨となるものです。」と語るのは、PReMoを開発、導入してきた山田悠介助教(写真)。学生の頃から実験でPFを利用し、今ではビームライン設計からシステム構築まで手掛けている。自身が実験をしてきたからこそ、ユーザーにとって使い易い、システムが作れるのだろう。

PReMoを開発した山田悠介助教。画面はPReMoで閲覧できる結晶化や回折データなど。

また構造生物学研究センター長の千田俊哉教授はPReMoの展望を次のように語る。「最終的にはね、PFだけじゃなくて、SPring-8や他の放射光施設も合わせたデータベースにしたいんだ。そして膨大なデータからA.I.(人工知能)で、結晶化や測定の条件の傾向を導けるようにしたいんだよね。」個々の研究室単位で扱えるタンパク質のデータは多くても十数種類程度。PFは、そうした研究室などにより年間約300件利用されている。これらの知を統合的に管理、活用することで、構造生物学にブレイクスルーをもたらそうとしている。

関連ページ

放射光科学研究施設フォトンファクトリー
物質構造科学研究所 構造生物学研究センター