TMBETA-GENOME

2015/12/11

Web Site: -
HTTPS Site: https://dbarchive.biosciencedbc.jp/data/tmbeta-genome/

ゲノム配列の解読が完了している生物種のゲノム中に含まれるβ−バレル型膜タンパク質のデータベース

README 目次

  1. ダウンロードデータの構成
  2. ダウンロードデータの説明
  3. 本データベースの利用許諾
  4. 更新履歴
  5. 参考文献
  6. 連絡先

1. ダウンロードデータの構成

  1. README
  2. Sequence Collection
  3. Sequence Classification
トップに戻る

2. ダウンロードデータの説明

2.1 README

データ名 README
データ内容 「TMBETA-GENOME」のダウンロードデータについて説明したHTMLファイル。
ダウンロードファイル名 README.html(日本語)
トップに戻る

2.2 データのリンク先一覧

データ名 Sequence Collection
データ内容の説明 β-バレル型膜タンパク質の予測を行ったゲノムの一覧。
複数の染色体があるゲノムは、染色体ごとにエントリを分けている。
データファイル tmbeta_genome_sequence_collection.zip (8.8 KB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
Sequence Collection ID 独自にゲノムに付与した通し番号
Classification 生物分類(Archaea、Bacteria、またはEukaryota)
Organism Name 生物種名。複数の染色体を持つ生物は染色体番号も含む。
Locus ゲノム配列のRefSeq ID
FASTA File ゲノム配列が記載されたFASTAファイル
トップに戻る

2.3 Sequence Classification

データ名 Sequence Classification
データ内容の説明 ゲノムの各アミノ酸配列に対し、統計的手法と機械学習を使って、β-バレル型膜タンパク質またはヘリックス型膜タンパク質の判別を行った結果の一覧。
統計的手法はアミノ酸、ジペプチド(連続2残基)、モチーフ(1残基ギャップを挟んだ2残基)の組成(出現頻度)に基づいて行い、機械学習はアミノ酸やジペプチドの組成を主な特徴量として用いて行った。
データファイル tmbeta_enome_sequence_classification.zip (177 MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
Sequence ID 独自にアミノ酸配列に付与した通し番号
Sequence Collection ID 独自にゲノムに付与した通し番号
New Approach 新たに開発した手法により、β-バレル型膜タンパク質の判別を行った結果。
本手法は以下のステップで実行される。
  1. β-バレル型膜タンパク質と球状タンパク質のジペプチドの出現傾向を用い、β-バレル型膜タンパク質を検出する
  2. さらに、β-バレル型膜タンパク質とヘリックス型膜タンパク質のジペプチドの出現傾向を用い、β-バレル型膜タンパク質を絞り込む
  3. 配列長が50以下のタンパク質を除く
  4. SOSUIで膜貫通ヘリックス部位が2箇所以上予測されたタンパク質を除く
  5. 80%の配列領域において、PDBに登録されている球状タンパク質とヘリックス型膜タンパク質に対し、70%を超える同一性のあるタンパク質を除く
  6. SWISS-PROTに登録されている球状タンパク質とヘリックス型膜タンパク質に対し、80%を超える同一性のあるタンパク質を除く
SOSUI 膜タンパク質予測ツールであるSOSUIを使い、ヘリックス型膜タンパク質の判別を行った結果
Amino Acid アミノ酸組成を使った統計的手法(TMBETADISC-COMP)により、β-バレル型膜タンパク質の判別を行った結果
Dipeptide ジペプチドの出現傾向を使った統計的手法(TMBETADISC_DIPEPTIDE)により、β-バレル型膜タンパク質の判別を行った結果
Motif 上記のモチーフを使った統計的手法(TMBETADISC-MOTIF)により、β-バレル型膜タンパク質の判別を行った結果
SVM アミノ酸組成とジペプチド出現傾向をSVM(Support Vector Machine)で機械学習を行った分類器(TMBETA-SVM)を使い、β-バレル型膜タンパク質の判別を行った結果
Header FASTAファイルに記載されたアミノ酸配列データのヘッダ行
Sequence アミノ酸配列
トップに戻る

3. 本データベースの利用許諾

利用許諾更新日: 2015/03/09

本データベースは、以下で定める利用許諾に基づきご利用いただくことができます。 本利用許諾は、本データベース利用における許諾内容、及び利用者が従うべき条件を定めています。

Creative Commons License

本データベースの利用許諾は、クリエイティブ・コモンズ 表示-継承2.1 日本の定める利用許諾です。
本データベースのクレジットは、 ”TMBETA-GENOME © Michael Gromiha (産業技術総合研究所 生命情報科学研究センター) licensed under CC表示-継承2.1 日本”ですので、 利用にあたり必ず表示してください。

クリエイティブ・コモンズ 表示-継承2.1 日本の概要は こちらです。 具体的な許諾条項は こちらをご覧ください。

本データベースにおいて、標準利用許諾の下で以下の条件に従う限り許諾されている事項:

  1. 本データベースの全部または一部に自由にアクセスし、データを取得することができます。
  2. 本データベースの全部または一部のデータを自由に再配布することができます。
  3. 本データベースの全部または一部のデータを利用した、データベースなどの二次的著作物を自由に作成し、配布することができます。

本データベースにおいて、標準利用許諾に基づいて利用する際に従うべき条件:

  1. 本データベースの全部または一部、あるいは二次的著作物の配布に際しては、本データベースの作成者のクレジットを表示しなければなりません。
  2. 本データベースの全部または一部のデータを利用して作成された二次的著作物は、この利用許諾の下で配布されなければなりません。
  3. 本利用許諾で許諾されていない事項については、以下のデータベース作成者に連絡をとり、利用許諾を求める必要があります。

データベース作成者連絡先:
Dr. M. MICHAEL GROMIHA
Associate Professor
Department of Biotechnology
IIT Madras
Chennai - 600 036
Tel: +91-44-2257-4138(O)
E-mail: gromiha[at]iitm[dot]ac[dot]in
http://www.iitm.ac.in/bioinfo/Gromiha/

トップに戻る

4. 更新履歴

更新日 更新内容
2015/12/11 データベースの説明の以下の情報を更新
  • データベース運用場所
  • オリジナルサイト(公開終了)
  • 統括サイト
2015/03/09 生命科学系データベースアーカイブにてダウンロードデータ公開開始
トップに戻る

5. 参考文献

Gromiha MM, Yabuki Y, Kundu S, Suharnan S, Suwa M.
TMBETA-GENOME: database for annotated beta-barrel membrane proteins in genomic sequences.
Nucleic Acids Res. 2007 Jan;35(Database issue):D314-6. Epub 2006 Nov 6.
PMID: 17088282

トップに戻る

6. 連絡先

「TMBETA-GENOME」についてのお問い合わせは、下記連絡先までご連絡ください。

データベース作成者連絡先:
Dr. M. MICHAEL GROMIHA
Associate Professor
Department of Biotechnology
IIT Madras
Chennai - 600 036
Tel: +91-44-2257-4138(O)
E-mail: gromiha[at]iitm[dot]ac[dot]in
http://www.iitm.ac.in/bioinfo/Gromiha/

トップに戻る