- あのデータベースが、丸ごとダウンロード可能に!-
[ Japanese | English ]
このデータベースについて

LD_bin Data (Phase III)

データ説明
データ名
LD_bin Data (Phase III)
DOI
10.18908/lsdba.nbdc00036-008
データ内容の説明
D3(Phase III)の連鎖不平衡領域(LD bin)の算出結果。 GFFフォーマットのファイルで、2種類の行が含まれており、カラム#3で区別されている。 ・LD_BIN行 : LD binに含まれるSNP、さらにtagSNP、Best tagSNP(※)を示す。 ・LD_BIN_BOUNDARIES行 : LD binの境界を示す。 (※Best tagSNP:LD bin内の他のSNPに対するr<sup>2</sup>の平均が最高値を示すSNP)
データファイル
データファイル名 :
bin_3R80M5Zb36.gff.gz (GFF形式)
データのURL :
ファイルサイズ :
12.8MB
簡易検索URL
-
データ取得方法

「Genotype Data (Phase III)」を解析

解析方法

連鎖不平衡の尺度としてSNP間(お互いの距離が300 kb以内であるもの)のr2を計算した。このとき解析対象としたSNPはアレル頻度5%以上に限定した。相互のr2が0.8以上であるSNPをLD binにまとめ、その中からtagSNPおよびbest tagSNP(tagSNPの中で、他のSNPsに対するr2の平均が最も高いもの)を選んだ。LD binおよびtagSNPの計算にはCarlsonら(AJHG 74: 106-120, 2004)のldSelectと同様の原理に基づくTagzillaプログラムを用いた。

データ件数

SNP: 565,646件
LD Bin: 250,751件

データ詳細
項目名 項目の説明
#1

seqname

#2

source

#3

feature

#4

start

#5

end

#6

score

#7

strand

#8

frame

#9

attributes