ハプロタイプデータ解析ツール
関節リウマチ関連遺伝子研究チーム
平成16年7月30日
<メニュー>
1 ハプロタイプ型情報からtag SNPを検出するページ→出力サンプル
2 ハプロタイプ型をその型の類似度でソートするページ→出力サンプル
単純な系統図を描くための書式も同時に提供します
3 遺伝子・SNP・SNPとの関連強度・LD・ハプロタイプ頻度を一括描図するページ
● tag SNP検出の方法はminimal haplotype tagging 法(Paola Sebastiani et al. PNAS 100 9900-9905,2003)を用いました。最適解を求める方法ですので、ハプロタイプ数が多すぎると処理不能に陥ります。このtag SNP検出プログラムは、ホールゲノムハプロタイプ解析 (http://10.64.230.16/)においても動いており、算出されている疾患チーム別のブロック・ハプロタイプ解析データベースにおいて参照可能です。
● ハプロタイプ型の類似度ソートは、ハプロタイプをテーブル提示するときに、適当な並べ方をするために作製しました。提示にあたっては、頻度順に並べたい場合と、似通ったハプロタイプ同士を近く同士に並べたい場合があると思います。そのためのツールです。類似度で並べるにあたっては、進化系統樹作成の方法を利用しました。ハプロタイプ構成SNPアレルが合致するか否かのみを点数化し、ハプロタイプペアの差異を距離表現し、Neighbor-Joining法によって、系統樹化する方法を採用しています。せっかく系統樹的な扱いをしたので、その系統樹も描けるようにしてあります。ただし、ハプロタイプの類似度は、組換えを考慮する必要があり、いわゆる進化系統樹作成とは異なる点があることに留意してください。出力の一部である、 ((h3:0,h4:0):0.1875,((h1:0,h2:0):0.8125,((h5:0,h6:0):1.125,(h7:1.55,h8:0.2):1.125):0.8125):0); という表記は、系統樹を描くための書式です。フリーのアプリケーションTreeView http://taxonomy.zoology.gla.ac.uk/rod/treeview.html などに読み込ませると、簡単に絵に変換できます。以下はその表示例です。また、フリーの統計解析アプリケーション『R』(http://www.r-project.org/)をWINDOWS,Mac,LINUX,UNIX等にインストールし、パッケージ「ape」を付け加えることで同様の描図が可能です。Rは情報解析チーム・遺伝子多型解析チーム・統計解析チーム・RAチームなどで利用可能だと思います。
● 遺伝子・SNP・ハプロタイプ・LDの描図ツールも疾患チーム別ブロック・ハプロタイプ解析データ(http://10.64.230.16/)の表示ツールとしても実装準備中です。
<謝辞>
この諸ツールの公開にあたっては、解析・開発環境を使わせてくださっている情報解析チームの角田先生のご理解・ご協力に感謝いたします。
また、情報解析チームの皆さん(特にテクニカルスタッフの川上さん、川口さん)から諸技術の多大な提供を受けました。また、遺伝子多型解析チームの石倉さん(インテック・ウェブ・アンド・ゲノム・インフォマティクス(株))にも、非常に多くのことを教えていただいています。また、MIチーム田中先生とテクニカルスタッフの山野辺さん、OAチームの池川先生、GIチームの尾内先生には、ブロック・ハプロタイプ解析関連の諸データを、ベータ版状態だった時期から、積極的に活用していただき、適切な助言をいただきますと同時に、いくつものバグを報告していただいておりますことをこの場を借りてお礼申し上げます。また、大規模にリウマチ関連遺伝子群を解析したい、そのためには作業のルーチン化・ツール化が望ましいという、ツール作製の動機付けをしてくれているリウマチチームのスタッフの皆さんにも感謝しております。
SRCをはじめとする世界のSNP解析が今後も実りあるものであるますように。
<TreeViewによる系統樹表示例>