RefExについて

組織や臓器およびそれらを構成する細胞の機能および状態に特徴的な遺伝子発現パターンを定量的・定性的に調べることは、網羅的な遺伝子発現解析の目的のひとつです。このような目的のためにマイクロアレイや発現タグ収集など様々な実験手法が用いられ、多種多様な大規模データがパブリックデータベース上にそれぞれ独立に公開されています。

RefEx (Reference Expression dataset)は、4つの異なる実験手法(EST、GeneChip、CAGE、RNA-seq)によって得られた40種類の正常組織における遺伝子発現データを統合し並列に表現することで、手法間の比較とともに各遺伝子の発現量を直感的に比較することが可能なリファレンス(参照)データセットです。

RefExの特長

  • 正常組織・臓器の遺伝子発現状況を ひと目で
    • 4つの異なる実験手法によって得られた40種類の正常組織・臓器における遺伝子発現データを並列に表現することで、手法間の比較とともに各遺伝子の発現量を直感的に比較することができます。論文を読んでいて見かけた馴染みのない遺伝子がどの組織・臓器で発現しているのか、どんな特徴があるのかを論文の記述ではなく、バイアスの少ない実際の測定データから研究者自身の目で簡単に確認することができます。「知りたいことが予め決まっている」ことを検索するだけでなく「探索的に何らかの知見を得られる」ことを志向しています。
  • 調べたい遺伝子を より探しやすく より分かりやすく
    • もっとも基本的なキーワード・遺伝子名検索では逐次的に検索語候補が提示されるので、遺伝子名をすべて正確に入力する必要はありません。また、『転写因子』や『Gタンパク質共役受容体』などのようなあるカテゴリーに属する遺伝子についてまとめて検索・比較できるよう整理されています。さらに、さまざまな実験における比較対照などに用いられる『組織特異的遺伝子』を測定データから独自に算出し、組織ごとに一覧することができます。Advanced searchや絞り込み検索を使えば、複雑な検索条件も指定可能で、目的とするデータに簡単に行き着くことができます。
  • 直感的な可視化で 新たな知識発見・仮説構築を
    • 検索結果の一覧や個々の遺伝子についての詳細ページでは、 組織間の比較と測定手法間の比較を両立させた相対発現量のバーチャートを表示するとともに人体の3Dモデルに発現量を反映させたヒートマップを表示しています。また、リスト機能を用いて任意で選んだ最大3つの遺伝子について、発現データを含む全ての詳細データを並列に比較することができ、遺伝子発現解析などで見出された不詳な遺伝子群の関係性を知るためのツールとしても有用です。
  • 再利用可能で有用なパブリックデータの活用例
    • RefExで使用しているデータは、だれでも利用可能な公的データベースの中から、正常組織・臓器における遺伝子発現データのリファレンスとするにふさわしいデータセットを、測定サンプルの広範さなどを基準に選び出し、クオリティチェックを行い、互いに比較できるように整理しなおしたものです。さらに、RefExが提供するすべてのデータは、クリエイティブ・コモンズ (CC) ライセンス ( © DBCLS Licensed under CC 表示 4.0 国際)のもとで、自由にダウンロードおよび再利用することができます。RefExは生命科学データの共有および再利用の活用例のひとつであり、データ駆動型研究のためのツールとしてだれでも自由に使うことができます。

RefExで採用している4つの実験手法

  • EST
    •  NCBI UniGeneでまとめられたクローン情報を各ESTのライブラリーの記載を元に、 ライブラリーの材料別に展開して集計した材料種類別のクローン数です。
  • GeneChip
    •  NCBI GEOから取得したAffymetrix社が作製したDNAマイクロアレイ「GeneChip」 によって測定された発現データです。取得したCELファイルはRMA (robust multiarray average)を用いて正規化しています。
  • CAGE
    •  RIKEN FANTOM5 プロジェクトで集められたCAGE (Cap Analysis Gene Expression; キャップのついたmRNAの5’末端を捉えてシーケンスする手法) データです。ゲノムにマップされたCAGEタグの頻度情報はその転写物の発現量を反映していることを利用して発現データとしています。タグカウントを元にした発現データはTPM(Tag per million)で正規化しています。
  • RNA-seq

オリジナルデータ

  • EST
  • GeneChip
    • ヒト: GSE7307(Human body index - transcriptional profiling)
    • マウス: GSE10246(GNF Mouse GeneAtlas V3)
    • ラット: GSE952(Transcriptome analysis in rat)
  • CAGE
    • ヒト: PRJDB3010 (A promoter level mammalian expression atlas (human, ChIP-Seq))
    • マウス: PRJDB1100 (FANTOM5 Mouse CAGE)
  • RNA-seq
    • ヒト: PRJEB2445 (RNA-Seq of human individual tissues and mixture of 16 tissues (Illumina Body Map))
    • マウス: PRJNA30467(Mapping and quantifying mammalian transcriptomes by RNA-Seq; brain, liver, muscle)

オリジナルデータの処理

RefExに収載するためにオリジナルデータを整理・加工していますが、それらの方法の詳細については、 GitHubに記載しています。

加工済みデータおよびサンプルアノテーション情報

ダウンロード ページから利用可能です。また、これらのデータセットには、引用する際に利用できるDOIが付与されており、それらはfigshareからも閲覧できます

推奨閲覧ブラウザ

このサイトは、以下のブラウザ(最新版)で正常に動作します。

  • Firefox
  • Safari
  • Google Chrome
  • Internet Explorer

特に現在のインターフェース機能はIE 7.0 およびそれ以前のバージョンでは正常動作しませんので、ご注意ください。 (JSONオブジェクトがないため、詳細ページの3Dマップが表示されません。)

謝辞

生物種および臓器の画像は、ライフサイエンス統合データベースセンター (DBCLS) が提供する「Togo picture gallery」を利用しています ( Togo picture gallery, © DBCLS Licensed under CC 表示 2.1 日本 )。

また、人体3Dモデルを用いたヒートマップ画像の作成には、DBCLS が提供する「BodyParts3D」を利用しています ( BodyParts3D, © DBCLS licensed under CC 表示 継承 2.1 日本 )

お問い合わせ

本サイトに関するお問い合わせはDBCLSのお問い合わせフォームからお願いします。