- あのデータベースが、丸ごとダウンロード可能に!-
[ Japanese | English ]

データのメタデータ検索

キーワードで検索
項目で検索
全 696 件 (66件から70件)
件を表示
データ名 データベース名 DOI 説明 データ取得方法 解析方法 データ詳細
Genotype Data (Phase III) D-HaploDB 10.18908/lsdba.nbdc00036-006

D3(Phase III)の遺伝子型データ(876K SNP、87サンプル分)。
基本的にはKukita et al. (2010)記載の通りに作成されているが、論文のQCはより厳しくさらに2サンプル(CHM010とCHM035)が排除されている。ダウンロードデータにはコピー数多型(CNV)は含まれていない。

Affymetrix SNP 6.0 arrays によるジェノタイピング

全胞状奇胎(CHM)100検体をAffymetrix SNP 6.0 arrays でジェノタイピングした。アノテーションにはゲノム参照配列 NCBI Build36 を使用した。Kukita et al.(2010)に記載の方法に従って、蛍光シグナル比(log2R)が低値であったSNP、CNV解析により欠失領域にあると判定されたSNP、およびヘテロと判定されたSNPをノーコールに変換した。このあとサンプルコール率およびSNPコール率によるQCを行い最終的に87CHMについての876KSNPのタイピング結果を取得した。

データ詳細 open_in_full
LD bin 一覧 (Phase II) D-HaploDB 10.18908/lsdba.nbdc00036-003

D2(Phase II)のLD bin 一覧。
LD bin (連鎖不平衡領域)は、r2 (連鎖不平衡の指標)の高いSNP同士をグループ化したもの。
Phase IIのデータ(Genotype DataとAnnotation Data)から、LD bin単位の情報を表形式にまとめたもの。

Perlegen 281K arrays、Affymetrix 500K arrays

連鎖不平衡の尺度としてSNP間(お互いの距離が300 kb以内であるもの)のr2を計算した。このとき解析対象としたSNPはアレル頻度5%以上に限定した。相互のr2が0.8以上であるSNPをLD binにまとめ、その中からtagSNPおよびbest tagSNP(tagSNPの中で、他のSNPsに対するr2の平均が最も高いもの)を選んだ。LD binおよびtagSNPの計算にはCarlsonら(AJHG 74: 106-120, 2004)のldSelectプログラムをハプロイドデータを扱えるように改変して用いた。

データ詳細 open_in_full
LD bin 一覧 (Phase III) D-HaploDB 10.18908/lsdba.nbdc00036-004

D3(Phase III)のLD bin一覧。
LD bin (連鎖不平衡領域)は、r2 (連鎖不平衡の指標)の高いSNP同士をグループ化したもの。
Phase IIIのデータ(Genotype DataとAnnotation Data)から、LD bin単位の情報を表形式にまとめたもの。

Affymetrix SNP 6.0

連鎖不平衡の尺度としてSNP間(お互いの距離が300 kb以内であるもの)のr2を計算した。このとき解析対象としたSNPはアレル頻度5%以上に限定した。相互のr2が0.8以上であるSNPをLD binにまとめ、その中からtagSNPおよびbest tagSNP(tagSNPの中で、他のSNPsに対するr2の平均が最も高いもの)を選んだ。LD binおよびtagSNPの計算にはCarlsonら(AJHG 74: 106-120, 2004)のldSelectと同様の原理に基づくTagzillaプログラムを用いた。

データ詳細 open_in_full
LD_bin Data (Phase II) D-HaploDB 10.18908/lsdba.nbdc00036-007

D2(Phase II)の連鎖不平衡領域(LD bin)の算出結果。
GFFフォーマットのファイルで、2種類の行が含まれており、カラム#3で区別されている。
・LD_BIN行 : LD binに含まれるSNP、さらにtagSNP、Best tagSNP(※)を示す。
・LD_BIN_BOUNDARIES行 : LD binの境界を示す。
(※Best tagSNP:LD bin内の他のSNPに対するr2の平均が最高値を示すSNP)

「Genotype Data (Phase II)」を解析

連鎖不平衡の尺度としてSNP間(お互いの距離が300 kb以内であるもの)のr2を計算した。このとき解析対象としたSNPはアレル頻度5%以上に限定した。相互のr2が0.8以上であるSNPをLD binにまとめ、その中からtagSNPおよびbest tagSNP(tagSNPの中で、他のSNPsに対するr2の平均が最も高いもの)を選んだ。LD binおよびtagSNPの計算にはCarlsonら(AJHG 74: 106-120, 2004)のldSelectプログラムをハプロイドデータを扱えるように改変して用いた。

データ詳細 open_in_full
LD_bin Data (Phase III) D-HaploDB 10.18908/lsdba.nbdc00036-008

D3(Phase III)の連鎖不平衡領域(LD bin)の算出結果。
GFFフォーマットのファイルで、2種類の行が含まれており、カラム#3で区別されている。
・LD_BIN行 : LD binに含まれるSNP、さらにtagSNP、Best tagSNP(※)を示す。
・LD_BIN_BOUNDARIES行 : LD binの境界を示す。
(※Best tagSNP:LD bin内の他のSNPに対するr2の平均が最高値を示すSNP)

「Genotype Data (Phase III)」を解析

連鎖不平衡の尺度としてSNP間(お互いの距離が300 kb以内であるもの)のr2を計算した。このとき解析対象としたSNPはアレル頻度5%以上に限定した。相互のr2が0.8以上であるSNPをLD binにまとめ、その中からtagSNPおよびbest tagSNP(tagSNPの中で、他のSNPsに対するr2の平均が最も高いもの)を選んだ。LD binおよびtagSNPの計算にはCarlsonら(AJHG 74: 106-120, 2004)のldSelectと同様の原理に基づくTagzillaプログラムを用いた。

データ詳細 open_in_full
データ名 データベース名 DOI 説明 データ取得方法 解析方法 データ詳細