MicrobeDB.jp

2017/06/29

Web Site: http://microbedb.jp/
FTP Site: ftp://ftp.biosciencedbc.jp/archive/microbedb/

ゲノム情報を核として様々な微生物学上の知識統合したデータベース

README 目次

  1. ダウンロードデータの構成
  2. ダウンロードデータの説明
  3. 本データベースの利用許諾
  4. 更新履歴
  5. 参考文献
  6. 連絡先

1. ダウンロードデータの構成

  1. README
  2. Refsequence
  3. Ortholog
  4. GTPS
  5. SRA
  6. MBGD
  7. BRC
  8. GOLD
  9. NCBI
  10. Disease
  11. Ontology
トップに戻る

2. ダウンロードデータの説明

2.1 README

データ名 README
データ内容 「MicrobeDB.jp」のダウンロードデータについて説明したHTMLファイル。
ダウンロードファイル名 README.html (日本語)
トップに戻る

2.2 Refsequence

データ名 Refsequence
データ内容の説明

微生物の高精度ドラフトまたは完全ゲノム(RefSeq/GenBank)のアノテーション情報をRDF化したデータです。対応するアミノ酸配列データは、MicrobeDB.jp version 2において、MBGDのオーソログクラスタリングや、メタゲノム中の遺伝子の機能推定等に用いております。
データファイル(tar.gzip圧縮)はゲノムごとのディレクトリに分かれており、repliconごとのゲノムRDFファイルが存在します。

データファイル refsequence.tar.gz (49 GB)
トップに戻る

2.3 Ortholog

データ名 Ortholog
データ内容の説明

2015年1月版のMBGDに存在する、微生物オーソログの情報をRDF化したデータです。Refsequenceのゲノム配列を基にオーソログクラスタリングをすることで、作成しました。メタゲノム中の遺伝子の機能推定等に用いております。各オーソログクラスタがどの系統由来のどの遺伝子から構成されているか、およびそのクラスタの機能分類等の情報がRDFファイルに記述されています。

データファイル ortholog.tar.gz (5.5 GB)
トップに戻る

2.4 GTPS

データ名 GTPS
データ内容の説明

公開微生物ゲノム情報を定期的に再アノテーションし全タンパク質コード遺伝子の品質評価を加えたデータベースGene Trek in Prokaryote Space (GTPS)のデータをRDF化したデータです。

データファイル gtps.tar.gz (1.6 GB)
トップに戻る

2.5 SRA

データ名 SRA
データ内容の説明

INSDC DRA/ERA/SRA由来のメタ16S・メタゲノムサンプルに付随した情報をRDF化したデータ。メタデータはオントロジー(MEO/MSV/Taxonomy)を用いてアノテーション付けされています。統一された解析パイプラインでサンプルごとに配列を解析し、系統および遺伝子機能組成を推定したデータも存在します。
データファイル(tar.gzip圧縮)は複数のディレクトリに分かれています(データ詳細参照)。

データファイル sra.tar.gz (8.4 MB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
sra/metadata/meo_mapping/ INSDC DRA/ERA/SRAのメタ16S・メタゲノムサンプルの環境情報をMEOでアノテーションしたRDFファイルです。
sra/metadata/msv_mapping/ INSDC DRA/ERA/SRAのメタ16S・メタゲノムサンプルの環境関連のメタデータのRDFファイルです。
sra/metadata/host_taxonomy_mapping/ INSDC DRA/ERA/SRAのメタ16S・メタゲノムサンプルの宿主の情報をNCBI TaxonomyでアノテーションしたRDFファイルです。
sra/metadata/sra_description/ INSDC DRA/ERA/SRAのメタ16S・メタゲノムサンプルのメタデータ(環境関連の記述以外)のRDFファイルです。
sra/analysis/sra/function/mbgd/ INSDC DRA/ERA/SRAのメタゲノムサンプルのMBGDオーソログクラスタ組成のRDFファイルです。
sra/analysis/sra/function/mgfo/ INSDC DRA/ERA/SRAのメタゲノムサンプルのMBGDオーソログ機能組成のRDFファイルです。
sra/analysis/sra/function/ko/ INSDC DRA/ERA/SRAのメタゲノムサンプルのKEGGオーソログ組成のRDFファイルです。
sra/analysis/sra/function/pathway/ INSDC DRA/ERA/SRAのメタゲノムサンプルのKEGGパスウェイ組成のRDFファイルです。
sra/analysis/sra/taxonomy/ INSDC DRA/ERA/SRAのメタ16S・メタゲノムサンプルの系統組成のRDFファイルです。
sra/analysis/env/function/mbgd/ MEOごとにINSDC DRA/ERA/SRAのメタゲノムサンプルのMBGDオーソログクラスタ組成を集計したRDFファイルです。
sra/analysis/env/function/mgfo/ MEOごとにINSDC DRA/ERA/SRAのメタゲノムサンプルのMBGDオーソログ機能組成を集計したRDFファイルです。
sra/analysis/env/function/ko/ MEOごとにINSDC DRA/ERA/SRAのメタゲノムサンプルのKEGGオーソログ機能組成を集計したRDFファイルです。
sra/analysis/env/function/pathway/ MEOごとにINSDC DRA/ERA/SRAのメタゲノムサンプルのKEGGパスウェイ組成を集計したRDFファイルです。
sra/analysis/env/taxonomy/meta16s/ MEOごとにINSDC DRA/ERA/SRAのメタ16Sサンプルの系統組成を集計したRDFファイルです。
sra/analysis/env/taxonomy/metagenome/ MEOごとにINSDC DRA/ERA/SRAのメタゲノムサンプルの系統組成を集計したRDFファイルです。
トップに戻る

2.6 MBGD

データ名 MBGD
データ内容の説明

微生物比較ゲノムデータベースMBGDで構築しているオーソロググループやその他の関連情報をRDF化したデータです。

データファイル mbgd.tar.gz (671 MB)
トップに戻る

2.7 BRC

データ名 BRC
データ内容の説明

NBRCとJCMから提供していただいた菌株データを、MCCVやMEO等のオントロジーを利用しRDF化したデータです。
データファイル(tar.gzip圧縮)は2つのディレクトリに分かれています(データ詳細参照)。

データファイル brc.tar.gz (6.7 MB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
brc/nbrc/ NBRC保存菌株のRDFファイルです。
brc/jcm/ JCM保存菌株のRDFファイルです。
トップに戻る

2.8 GOLD

データ名 GOLD
データ内容の説明

JGI GOLDに存在するゲノム解読済み微生物のメタデータについて、MPOを用いて表現型をアノテーションした結果と、各微生物の系統をNCBI Taxonomyでアノテーションした結果のRDFデータです。

データファイル gold.tar.gz (882 KB)
トップに戻る

2.9 NCBI

データ名 NCBI
データ内容の説明

MicrobeDB.jp version 2で使用するNCBI関連データをRDF化したデータです。
データファイル(tar.gzip圧縮)は4つのディレクトリに分かれています(データ詳細参照)。

データファイル ncbi.tar.gz (79 MB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
ncbi/bioproject/ NCBI BioProjectのメタデータのRDFファイルです。
ncbi/biosample/ NCBI BioSampleのメタデータについて、MEO,MSV,NCBI Taxonomyを用いてアノテーションしたRDFファイルです。
ncbi/pubmed/ PubMedのメタデータのRDFファイルです。
ncbi/assembly/ NCBI AssemblyのAssembly ReportsのメタデータのRDFファイルです。
トップに戻る

2.10 Disease

データ名 Disease
データ内容の説明

微生物の系統名と関連する病気とその症状、および原因遺伝子の情報をNCBI TaxonomyやPDO、CSSO等のオントロジーを用いて紐付けたRDFデータです。

データファイル disease.tar.gz (1.2 MB)
トップに戻る

2.11 Ontology

データ名 Ontology
データ内容の説明

MicrobeDB.jp version 2で使用している様々なオントロジーのファイルです。
ただし、Sequence Ontology(SO)やGene Ontology(GO)などの広く流通しているオントロジーは含みません。
データファイル(tar.gzip圧縮)は複数のディレクトリに分かれています(データ詳細参照)。

データファイル ontology.tar.gz (91 MB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
ontology/meo/meo.ttl 微生物の生息環境を定義したオントロジー MEO
ontology/meo/meo_fma_mapping.ttl MEOのIDとFMA(Foundational Model of Anatomy)とのIDマッピングのデータのRDFファイルです。
ontology/msv/msv.ttl メタゲノムのサンプルリング環境について記述する際に使用する語彙を定義したオントロジー MSV
ontology/mdbv/mdbv.rdf MicrobeDB.jp version 2で使用する語彙を定義したオントロジー MDBV
ontology/mgfo/mgfo.ttl MBGDによる微生物の遺伝子の機能分類を定義したオントロジー MGFO
ontology/pdo/pdo.owl 微生物が関連する病気を定義したオントロジー PDO
ontology/csso/csso.owl PDOで定義した病気が引き起こす症状を定義したオントロジー CSSO
ontology/mpo/mpo.ttl 微生物の表現型を定義したオントロジー MPO
ontology/mccv/mccv.ttl 菌株保存機関の菌株情報について記述するための語彙を定義したオントロジー MCCV
ontology/taxonomy/taxonomy.ttl 生物の系統関係を記述するためのオントロジー NCBI Taxonomyについて、DDBJで独自にRDF化したファイルです。
ontology/insdc/nucleotide.ttl INSDCで使用する用語を定義したオントロジーです。
トップに戻る

3. 本データベースの利用許諾

利用許諾更新日: 2017/06/29

本データベースは、以下で定める利用許諾に基づきご利用いただくことができます。 本利用許諾は、本データベース利用における許諾内容、及び利用者が従うべき条件を定めています。


Creative Commons License

本データベースの利用許諾は、 クリエイティブ・コモンズ 表示-継承4.0 国際の定める利用許諾です。
本データベースのクレジットは、 ”MicrobeDB.jp © 黒川顕 (国立遺伝学研究所・生命情報研究センター) licensed under CC表示-継承4.0 国際”ですので、 利用にあたり必ず表示してください。

クリエイティブ・コモンズ 表示-継承4.0 国際の概要は こちらです。 具体的な許諾条項は こちらをご覧ください。

本データベースにおいて、以下の条件に従う限り許諾されている事項:

  1. 本データベースの全部または一部に自由にアクセスし、データを取得することができます。
  2. 本データベースの全部または一部のデータを自由に再配布することができます。
  3. 本データベースの全部または一部のデータを利用した、データベースなどの翻案物を自由に作成し、配布することができます。

 

本利用許諾に基づいて利用する際に従うべき条件:

  1. 本データベースの全部または一部、あるいは翻案物の配布に際しては、本データベースの作成者のクレジットを表示しなければなりません。
  2. 本データベースの全部または一部のデータを利用して作成された翻案物は、CC表示-継承4.0(もしくは、それ以降のバージョン)、またはCC表示-継承互換ライセンス(リストはこちら)の下で配布されなければなりません。
  3. 本利用許諾で許諾されていない事項については、以下のデータベース作成者に連絡をとり、利用許諾を求める必要があります。

データベース作成者連絡先:
〒411-8540
静岡県三島市谷田1111
国立遺伝学研究所生命情報研究センター
黒川顕
E-mail: kk[at]nig[dot]ac[dot]jp

トップに戻る

4. 更新履歴

更新日更新内容
2017/06/29 生命科学系データベースアーカイブにてアーカイブV2を公開開始
以下の4つのデータを追加。 以下の4つのデータを更新。
2014/03/31 生命科学系データベースアーカイブにてダウンロードデータ公開開始
2011/12/12 MicrobeDB (http://microbedb.jp/)で公開開始
トップに戻る

5. 参考文献

-
トップに戻る

6. 連絡先

「MicrobeDB.jp」についてのお問い合わせは、下記連絡先までご連絡ください。

〒411-8540
静岡県三島市谷田1111
国立遺伝学研究所生命情報研究センター
黒川顕
E-mail: kk[at]nig[dot]ac[dot]jp

トップに戻る