DNAProbeLocator

2015/03/06

HTTPS Site: https://dbarchive.biosciencedbc.jp/data/dnaprobelocator/

多様なプラットフォームのマイクロアレイプローブ配列すべてを完全長cDNA配列に対してマッピングしたデータベース

README 目次

  1. ダウンロードデータの構成
  2. ダウンロードデータの説明
  3. 本データベースの利用許諾
  4. 更新履歴
  5. 参考文献
  6. 連絡先

1. ダウンロードデータの構成

  1. README
  2. Acegeneデータ
  3. Agilentデータ
  4. Genechipデータ
  5. Hix2snpデータ
  6. I・M・A・G・Eデータ
  7. Locuslinkデータ
  8. Refgene_exonデータ
  9. SNPデータ
トップに戻る

2. ダウンロードデータの説明

2.1 README

データ名 README
データ内容 「DNAProbeLocator」のダウンロードデータについて説明したHTMLファイル。
ダウンロードファイル名 README.html(日本語)
トップに戻る

2.2 Acegeneデータ

データ名 Acegeneデータ
データ内容の説明 DNAチップ研究所 AceGene(Human Oligo Chip 30K)に関するプローブデータです。
データファイル dnaprobelocator_acegene.zip (1.2MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
probe_set プローブセット名
probe プローブID
hit H-Invitational transcript ID (HIT)
hix H-Invitational cluster ID (HIX)
score プローブのマッピングスコア (BLASTスコア)
トップに戻る

2.3 Agilentデータ

データ名 Agilentデータ
データ内容の説明 Agilent社 Agilent-012097 Human 1A Oligo Microarray (V2) (G4110B)
Agilent社 Agilent-012391 Whole Human Genome Oligo Microarray (G4112A)
データファイル dnaprobelocator_agilent.zip (5.4MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
probe_set プローブセットID
PGID215:Human 1A Oligo Microarray
PGID247:Whole Human Genome Oligo Microarray
probe プローブ名 (AgilentのSPOT_ID)
no プローブに結合する複数のHIT_IDにおける通し番号
total_no プローブが結合するHITの数
hit H-Invitational transcript ID (HIT) 
hix H-Invitational cluster ID (HIX) 
acc GenBank accession number
hit_cnt 特定のHITへのプローブの結合領域の数
info プローブの結合位置情報 (結合開始座標:終了座標:ストランド:ミスマッチ数)
min_pos プローブが結合するHITの中での最小座標
max_pos プローブが結合するHITの中での最大座標
トップに戻る

2.4 Genechipデータ

データ名 Genechipデータ
データ内容の説明

Affymetrix GeneChip

  1. HG-Focus
  2. HG-U133A
  3. HG-U133A_2
  4. HG-U133B
  5. HG-U133_Plus_2
  6. HG-U95A
  7. HG-U95Av2
  8. HG-U95B
  9. HG-U95C
  10. HG-U95D
  11. HG-U95E
  12. HuGene FL
  13. HuEx-1_0
データファイル dnaprobelocator_genechip.zip (197MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
probe_set GeneChipのアレイ名
probe GeneChipのprobe set名
no プローブセットにおけるHIT-IDの違いに基づいた通し番号
total_no プローブセットに対応するHIT-IDの数
hit H-Invitational transcript ID (HIT) 
hix H-Invitational cluster ID (HIX) 
acc GenBank accession ID
hit_cnt プローブセット中の特定のHIT 配列に結合するプローブの数
info プローブマッピング位置情報 (各プローブの開始座標:終了座標:プローブの成分となる配列のID:ストランド:ミスマッチ数)
min_pos 最小座標
max_pos 最大座標
トップに戻る

2.5 Hix2snpデータ

データ名 Hix2snpデータ
データ内容の説明 H-Invitational cluster上のSNPに関する情報
データファイル dnaprobelocator_hix2snp.zip (37.7MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
hix H-Invitational cluster ID (HIX) 
num SNP数
snps SNPの位置情報 (開始座標:終了座標:NCBI dbSNP IDの"rs"以降数字部分)
トップに戻る

2.6 I・M・A・G・Eデータ

データ名 I・M・A・G・Eデータ
データ内容の説明 I.M.A.G.E コンソーシアムの cDNA 配列について、H-InvDB のユニークな転写物にマップした結果のリスト
データファイル dnaprobelocator_image.zip (689MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
probe_set プローブセット名
acc ESTのGenBank Accession ID
lst (full length cDNAのNCBI GenBank accession):(blastにおける対応開始位置)(type(+/-))(対応する配列の長さ):(4桁=score)(2桁=percentage)(probability)

*scoreは整数 または(整数部小数部併せて4桁の)小数
*percentageは00のとき100の意味
*probabilityは
・Zの場合、0
・_(整数)の場合、e-(整数)
・(整数)、つまり「_」なしの場合、(1桁)e-(残りの桁)
トップに戻る

2.7 Locuslinkデータ

データ名 Locuslinkデータ
データ内容の説明 遺伝子座に関するアノテーション情報

ただし、chrが「_random」を含むエントリは、各座標に関して注意が必要である。 UCSCの「_random」を含むゲノム配列の構成は、染色体中の位置が未確定のセグメントを 50,000bpのスペーサーで挟んで1本に繋いだものとなっている ( http://genome.ucsc.edu/FAQ/FAQdownloads.html#download9, http://genome.ucsc.edu/FAQ/FAQdownloads.html#download10 )。 このゲノム配列にHIT転写物がマッピングされているので、以下の座標表記となっている。
h_*:各セグメント上の座標を示す。セグメントの区別は記載なし。
なお同一転写物のexonが異なるセグメントにマッピングされているケースもある。
データファイル dnaprobelocator_locuslink.zip (2.5MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
hosac H-Invitational cluster ID (HIX)
chr 染色体番号
h_start 遺伝子座開始座標
h_end 遺伝子座終了座標
strand ストランド
ext H-Invitational transcript ID (HIT)
acc Genbank accession number
unigene Unigene entry name
locus Locus ID
omim Omim ID
definition Definition
トップに戻る

2.8 Refgene_exonデータ

データ名 Refgene_exonデータ
データ内容の説明 H-Invitational transcript ID (HIT) に関するアノテーション情報

ただし、chrが「_random」を含むエントリは、各座標に関して注意が必要である。 UCSCの「_random」を含むゲノム配列の構成は、染色体中の位置が未確定のセグメントを 50,000bpのスペーサーで挟んで1本に繋いだものとなっている ( http://genome.ucsc.edu/FAQ/FAQdownloads.html#download9, http://genome.ucsc.edu/FAQ/FAQdownloads.html#download10 )。 このゲノム配列にHIT転写物がマッピングされているので、以下の座標表記となっている。
a_*:各セグメント上の座標を示す。セグメントの区別は記載なし。
cds_*、e_*:セグメントを50,000bpのスペーサーを挟みつつ1本に繋いだ上での座標。
なお同一転写物のexonが異なるセグメントにマッピングされているケースもある。
データファイル dnaprobelocator_refgene_exon.zip (19.1MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
chr 染色体番号
a_start 転写物マッピングの開始座標
a_end 転写物マッピングの終了座標
a_name 転写物の名前
strand ストランド
cds_start CDS開始座標
cds_end CDS終了座標
exon_count エクソン数
e_start エクソン開始座標
e_end エクソン終了座標
ext H-Invitational transcript ID (HIT)
hosac H-Invitational cluster ID (HIX)
unigene Unigene entry name
locus Locus ID
omim Omim ID
definition Definition
product プロダクト
c_start cDNA開始座標
c_end cDNA終了座標
トップに戻る

2.9 SNPデータ

データ名 SNPデータ
データ内容の説明 各染色体上のSNPの座標やアリルタイプの情報
データファイル dnaprobelocator_snp.zip (93.8MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
chr 染色体番号
s_start SNP開始座標
s_end SNP終了座標
id SNP ID
type SNPのタイプ(genomeなど)
info SNPアリル情報
トップに戻る

3. 本データベースの利用許諾

利用許諾更新日: 2015/03/06

本データベースは、以下で定める利用許諾に基づきご利用いただくことができます。 本利用許諾は、本データベース利用における許諾内容、及び利用者が従うべき条件を定めています。

Creative Commons License

本データベースの利用許諾は、クリエイティブ・コモンズ 表示-継承2.1 日本の定める利用許諾です。
本データベースのクレジットは、 ”DNA ProbeLocator © 日紫喜 光良(東邦大学) licensed under CC表示 継承2.1 日本”ですので、 利用にあたり必ず表示してください。

クリエイティブ・コモンズ 表示-継承2.1 日本の概要は こちらです。 具体的な許諾条項は こちらをご覧ください。

本データベースにおいて、標準利用許諾の下で以下の条件に従う限り許諾されている事項:

  1. 本データベースの全部または一部に自由にアクセスし、データを取得することができます。
  2. 本データベースの全部または一部のデータを自由に再配布することができます。
  3. 本データベースの全部または一部のデータを利用した、データベースなどの二次的著作物を自由に作成し、配布することができます。

本データベースにおいて、標準利用許諾に基づいて利用する際に従うべき条件:

  1. 本データベースの全部または一部、あるいは二次的著作物の配布に際しては、本データベースの作成者のクレジットを表示しなければなりません。
  2. 本データベースの全部または一部のデータを利用して作成された二次的著作物は、この利用許諾の下で配布されなければなりません。
  3. 本利用許諾で許諾されていない事項については、以下のデータベース作成者に連絡をとり、利用許諾を求める必要があります。

データベース管理者連絡先:
(独)産業技術総合研究所
創薬分子プロファイリング研究センター
今西 規(Imanishi Tadashi)
E-mail: t[dot]imanishi[at]aist[dot]go[dot]jp

トップに戻る

4. 更新履歴

更新日 更新内容
2015/03/06 生命科学系データベースアーカイブにてダウンロードデータ公開開始
2005/07/23 DNA ProbeLocator (http://h-invitational.jp/DNAProbeLocator/index.cgi)で公開開始
トップに戻る

5. 参考文献

-

6. 連絡先

「DNAProbeLocator」についてのお問い合わせは、下記連絡先までご連絡ください。

(独)産業技術総合研究所
創薬分子プロファイリング研究センター
今西 規(Imanishi Tadashi)
E-mail: t[dot]imanishi[at]aist[dot]go[dot]jp
Tel: (代表)03-3599-8800

トップに戻る