PGDBj - オルソログデータベース

2016/07/29

Web Site: PGDBj - オルソログデータベース
FTP Site: ftp://ftp.biosciencedbc.jp/archive/pgdbj-ortholog-db/

異なる生物種間におけるアミノ酸配列の類似性に基づいた遺伝子のオルソログ情報を蓄積したデータベース

README 目次

  1. ダウンロードデータの構成
  2. ダウンロードデータの説明
  3. 本データベースの利用許諾
  4. 更新履歴
  5. 参考文献
  6. 連絡先

1. ダウンロードデータの構成

  1. README
  2. Protein (緑色植物)
  3. Cluster (緑色植物)
  4. Taxon (緑色植物)
  5. Protein (ラン藻)
  6. Cluster (ラン藻)
  7. Taxon (ラン藻)
トップに戻る

2. ダウンロードデータの説明

2.1 README

データ名 README
データ内容 「PGDBj - オルソログデータベース」のダウンロードデータについて説明したHTMLファイル。
ダウンロードファイル名 README.html(日本語)
トップに戻る

2.2 Protein (緑色植物)

データ名 Protein (緑色植物)
データ内容の説明 NCBI Reference Sequenceデータベースから取得した緑色植物のアミノ酸配列をNCBI GI番号およびReference Sequence IDと注釈情報を付記して整理したデータ。各系統群でアミノ酸配列が所属するオルソログデータベースのクラスターIDを併記。
データファイル pgdbj_ortholog_db_viridiplantae_protein.zip (85 MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
GI number アミノ酸配列のNCBI GI番号
RefSeq ID NCBI Reference Sequence ID
Cluster (Kingdom) クラスターID (分類群:Kingdom)
Cluster (Phylum) クラスターID (分類群:Phylum)
Cluster (No rank 1) クラスターID (分類群:No rank 1)
Cluster (No rank 2) クラスターID (分類群:No rank 2)
Cluster (No rank 3) クラスターID (分類群:No rank 3)
Cluster (No rank 4) クラスターID (分類群:No rank 4)
Cluster (No rank 5) クラスターID (分類群:No rank 5)
Cluster (No rank 6) クラスターID (分類群:No rank 6)
Cluster (No rank 7) クラスターID (分類群:No rank 7)
Cluster (No rank 8) クラスターID (分類群:No rank 8)
Cluster (Class) クラスターID (分類群:Class)
Cluster (Subclass) クラスターID (分類群:Subclass)
Cluster (No rank 9) クラスターID (分類群:No rank 9)
Cluster (Order) クラスターID (分類群:Order)
Cluster (Family) クラスターID (分類群:Family)
Cluster (No rank 10) クラスターID (分類群:No rank 10)
Cluster (Subfamily) クラスターID (分類群:Subfamily)
Cluster (Tribe) クラスターID (分類群:Tribe)
Cluster (Genus) クラスターID (分類群:Genus)
Cluster (Subgenus) クラスターID (分類群:Subgenus)
Cluster (Species) クラスターID (分類群:Species)
Cluster (Subspecies) クラスターID (分類群:Subspecies)
Cluster (Forma) クラスターID (分類群:Forma)
Cluster (No rank 11) クラスターID (分類群:No rank 11)
Annotation アミノ酸配列の注釈情報
Organism 生物種名
AA sequence アミノ酸配列

2.3 Cluster (緑色植物)

データ名 Cluster (緑色植物)
データ内容の説明 NCBI Reference Sequenceデータベースから取得した緑色植物のアミノ酸配列を配列間のBLASTによる網羅的なホモロジー情報に基づいて各系統群ごとにクラスタリ ングしたデータ。各系統群では1つのアミノ酸配列は必ず1つのクラスターに所属する。
データファイル pgdbj_ortholog_db_viridiplantae_cluster.zip (15.6 MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
Cluster ID オルソログクラスターに付けられるID
 各系統群でのオルソログクラスタは0からの通し番号(「クラスターID」)を付けて管理されている。異なった系統群での「クラスターID」を区別するためにTaxonomy IDを":"(コロン)で繋げて管理する。例えば、Taxonomy IDが"33090"の系統群の0番目の「クラスターID」は"33090:0"となる。「クラスターID」は「オルソログDB」が独自に付けているものである。
Explanatory note オルソログクラスターの注釈情報
 オルソログクラスターごとにアミノ酸配列の注釈情報に含まれる単語の頻度分布を集計し、その結果に基づいてそのオルソログクラスターの注釈としてより尤もらしい(出現頻度の高い単語をより多く含む)アミノ酸配列の注釈情報を採用している。
Cluster size クラスターに所属するアミノ酸配列数
Supercluster 1つ上位の系統群でのクラスターID
Subcluster 1つ下位の系統群でのクラスターID

2.4 Taxon (緑色植物)

データ名 Taxon (緑色植物)
データ内容の説明 緑色植物のオルソログクラスターの系統群に沿った再帰的な関係を示したデータ。
データファイル pgdbj_ortholog_db_viridiplantae_taxon.zip (2.3 KB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
Taxonomy name NCBI Taxonomy name
Taxonomy ID NCBI Taxonomy ID
Taxonomy rank NCBI Taxonomyのランク
Number of clusters 系統群に所属するクラスターの数
Number of proteins 系統群に所属するアミノ酸配列数
Higher taxon 1つ上位の系統群
Lower taxon 1つ下位の系統群

2.5 Protein (ラン藻)

データ名 Protein (ラン藻)
データ内容の説明 NCBI Reference Sequenceデータベースから取得したラン藻のアミノ酸配列をNCBI GI番号およびReference Sequence IDと注釈情報を付記して整理したデータ。各系統群でアミノ酸配列が所属するオルソログデータベースのクラスターIDを併記。
データファイル pgdbj_ortholog_db_cyanobacteria_protein.zip (60 MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
GI number アミノ酸配列のNCBI GI番号
RefSeq ID NCBI Reference Sequence ID
Cluster (Phylum) クラスターID (分類群:Phylum)
Cluster (Class) クラスターID (分類群:Class)
Cluster (Order) クラスターID (分類群:Order)
Cluster (No rank 1) クラスターID (分類群:No rank 1)
Cluster (Family) クラスターID (分類群:Family)
Cluster (No rank 2) クラスターID (分類群:No rank 2)
Cluster (Species) クラスターID (分類群:Species)
Cluster (No rank 3) クラスターID (分類群:No rank 3)
Cluster (Subspecies) クラスターID (分類群:Subspecies)
Cluster (No rank 4) クラスターID (分類群:No rank 4)
Annotation アミノ酸配列の注釈情報
Organism 生物種名
AA sequence アミノ酸配列

2.6 Cluster (ラン藻)

データ名 Cluster (ラン藻)
データ内容の説明 NCBI Reference Sequenceデータベースから取得したラン藻のアミノ酸配列を配列間のBLASTによる網羅的なホモロジー情報に基づいて各系統群ごとにクラスタリングしたデータ。各系統群では1つのアミノ酸配列は必ず1つのクラスターに所属する。
データファイル pgdbj_ortholog_db_cyanobacteria_cluster.zip (9.6 MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
Cluster ID オルソログクラスターに付けられるID
 各系統群でのオルソログクラスターは0からの通し番号(「クラスターID」)を付けて管理されている。異なった系統群での「クラスターID」を区別するためにTaxonomy IDを":"(コロン)で繋げて管理する。例えば、Taxonomy IDが"1117"の系統群の0番目の「クラスターID」は"1117:0"となる。「クラスターID」は「オルソログDB」が独自に付けているものである。
Explanatory note オルソログクラスターの注釈情報
 オルソログクラスターごとにアミノ酸配列の注釈情報に含まれる単語の頻度分布を集計し、その結果に基づいてそのオルソログクラスターの注釈としてより尤もらしい(出現頻度の高い単語をより多く含む)アミノ酸配列の注釈情報を採用している。
Cluster size クラスターに所属するアミノ酸配列数
Supercluster 1つ上位の系統群でのクラスターID
Subcluster 1つ下位の系統群でのクラスターID

2.7 Taxon (ラン藻)

データ名 Taxon (ラン藻)
データ内容の説明 ラン藻のオルソログクラスターの系統群に沿った再帰的な関係を示したデータ。
データファイル pgdbj_ortholog_db_cyanobacteria_taxon.zip (4.3 KB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
Taxonomy name NCBI Taxonomy name
Taxonomy ID NCBI Taxonomy ID
Taxonomy rank NCBI Taxonomyのランク
Number of clusters 系統群に所属するクラスターの数
Number of proteins 系統群に所属するアミノ酸配列数
Higher taxon 1つ上位の系統群
Lower taxon 1つ下位の系統群
トップに戻る

3. 本データベースの利用許諾

利用許諾更新日: 2014/04/04

本データベースは、以下で定める利用許諾に基づきご利用いただくことができます。 本利用許諾は、本データベース利用における許諾内容、及び利用者が従うべき条件を定めています。

Creative Commons License

本データベースの利用許諾は、クリエイティブ・コモンズ 表示-継承2.1 日本の定める利用許諾です。
本データベースのクレジットは、 ”PGDBj - オルソログデータベース © 中谷明弘 (大阪大学) licensed under CC表示 継承2.1 日本”ですので、 利用にあたり必ず表示してください。

クリエイティブ・コモンズ 表示-継承2.1 日本の概要は こちらです。 具体的な許諾条項は こちらをご覧ください。

本データベースにおいて、標準利用許諾の下で以下の条件に従う限り許諾されている事項:

  1. 本データベースの全部または一部に自由にアクセスし、データを取得することができます。
  2. 本データベースの全部または一部のデータを自由に再配布することができます。
  3. 本データベースの全部または一部のデータを利用した、データベースなどの二次的著作物を自由に作成し、配布することができます。

本データベースにおいて、標準利用許諾に基づいて利用する際に従うべき条件:

  1. 本データベースの全部または一部、あるいは二次的著作物の配布に際しては、本データベースの作成者のクレジットを表示しなければなりません。
  2. 本データベースの全部または一部のデータを利用して作成された二次的著作物は、この利用許諾の下で配布されなければなりません。
  3. 本利用許諾で許諾されていない事項については、以下のデータベース作成者に連絡をとり、利用許諾を求める必要があります。

データベース作成者連絡先:
〒565-0871 大阪府吹田市山田丘2-2
大阪大学 大学院医学系研究科 ゲノム情報学共同研究講座
中谷明弘
E-mail: pgdbj[at]kazusa[dot]or[dot]jp / nakaya[at]gi[dot]med[dot]osaka-u[dot]ac[dot]jp

トップに戻る

4. 更新履歴

更新日 更新内容
2016/07/29 データベースの説明のページにおいて、オリジナルサイト情報の「オリジナルサイト」および「一括ダウンロードサイト」を更新。
2014/04/04 生命科学系データベースアーカイブにてダウンロードデータ公開開始
2012/08/01 オルソログDB (http://pgdbj.jp/ortholog-db.html)で公開開始
トップに戻る

5. 参考文献

Erika Asamizu, Hisako Ichihara, Akihiro Nakaya, Yasukazu Nakamura, Hideki Hirakawa, Takahiro Ishii, Takuro Tamura, Kaoru Fukami-Kobayashi, Yukari Nakajima and Satoshi Tabata
Plant Genome DataBase Japan (PGDBj): A Portal Website for the Integration of Plant Genome-Related Databases
Plant Cell Physiol (2014) 55 (1): e8.
PMID:24363285

6. 連絡先

「PGDBj - オルソログデータベース」についてのお問い合わせは、下記連絡先までご連絡ください。

データベース作成者連絡先:
〒565-0871 大阪府吹田市山田丘2-2
大阪大学 大学院医学系研究科 ゲノム情報学共同研究講座
中谷明弘
E-mail: pgdbj[at]kazusa[dot]or[dot]jp / nakaya[at]gi[dot]med[dot]osaka-u[dot]ac[dot]jp

トップに戻る