SEVENS

2014/06/10

Web Site: SEVENS
FTP Site: ftp://ftp.biosciencedbc.jp/archive/sevens/

藻類のタンパク質と二次代謝反応の情報を集めたデータベース

README 目次

  1. ダウンロードデータの構成
  2. ダウンロードデータの説明
  3. 本データベースの利用許諾
  4. 更新履歴
  5. 参考文献
  6. 連絡先

1. ダウンロードデータの構成

  1. README
  2. Alternative products
  3. 生物種
  4. Exon
  5. Gene
  6. G-protein
  7. Ligand
  8. NCBI nr-aa BLAST
  9. PDB
  10. Pseudo gene
  11. Amino acid frequency
  12. Swiss-Prot BLAST
  13. Swiss-Prot Ligand
  14. Unigene BLAST
トップに戻る

2. ダウンロードデータの説明

2.1 README

データ名 README
データ内容 「SEVENS」のダウンロードデータについて説明したHTMLファイル。
ダウンロードファイル名 README.html(日本語)
トップに戻る

2.2 Alternative products

データ名 Alternative products
データ内容の説明 Swiss-Protに登録されているalternative products(同一遺伝子由来だがalternative splicingなどにより配列が異なるたんぱく質)の情報を格納しています
データファイル sevens_alterna.zip (1.86KB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
ID 遺伝子名
Number 連番
Swiss-Prot ID Swiss-Prot ID
Synonym シノニム
Isoform ID Isoform ID
トップに戻る

2.3 生物種

データ名 生物種
データ内容の説明 SEVENSで取り扱っている生物の種名とGPCR数などを格納しています。
データファイル sevens_db.zip (2.16KB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
SP_Code 生物種コード
Genome ゲノムデータベース名
GPCR No. GPCR数
Large Families (Level Aの)メンバの多いファミリーの名前
トップに戻る

2.4 Exon

データ名 Exon
データ内容の説明 遺伝子のExonに関する座標と塩基配列を格納しています。
データファイル sevens_exon.zip (30.0MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
ID 遺伝子名
Number 連番
Leftend エクソンの左末端
Rightend エクソンの右末端
Sequence 塩基配列
トップに戻る

2.5 Gene

データ名 Gene
データ内容の説明 SEVENSで解析した遺伝子に関するアノテーション情報を格納しています。
データファイル sevens_gene.zip (22.8MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
ID 遺伝子名
Pseudo pseudogeneか否か(空欄:gene pseudo:pseudogene)
Novel 新規であるか否か
Chromosome 染色体番号
Level レベル(A~D)※下表参照
Family ファミリー(分からない場合 "UNKNOWN")
Alternativeproducts Swiss-protにalternative productsの記載がない場合は空欄、ある場合はシノニム(シノニムがなければNONEと表記)
Swiss-Prot BLAST top hit 対Swiss-Protのトップヒット
Swiss-Prot BLAST top hit (E-value) 対Swiss-ProtのトップヒットのE-value
Swiss-Prot BLAST top hit (Identity) 対Swiss-ProtのトップヒットのIdentity
NCBI nr-aa BLAST top hit 対nrのトップヒット
NCBI nr-aa BLAST top hit (E-value) 対nrのトップヒットのE-value
NCBI nr-aa BLAST top hit (Identity) 対nrのトップヒットのIdentity
NCBI Unigene BLAST top hit 対Unigeneのトップヒット
NCBI Unigene BLAST top hit (E-value) 対UnigeneのトップヒットのE-value
NCBI Unigene BLAST top hit (Identity) 対UnigeneのトップヒットのIdentity
Expression Unigene ID
Ligand リガンド(複数知られている場合は1種のみ表示)
G-protein coupling G蛋白質とのカップリング(0がカップリングしない、1がカップリングする) 左から順に、Gi/o、Gq/11、Gs、G12/13
Sequence アミノ酸配列
Leftend 遺伝子の左末端
Rightend 遺伝子の右末端

※検出に用いられた閾値レベル

  Level A
(Best specificity)
Level B Level C Level D
(Best sensitivity)
Sequence search
with BLASTP
E < 10-80 E < 10-30 E < 10-30 E < 10-30
Domain assignment
with Pfam
E < 10-10 E < 1.0 E < 1.0 E < 1.0
Motif assignment
with PROSITE
Not used Match Match Match
TMH Prediction Not used TMwindows(7)
AND
SOSUI(7)
TMwindows(7)
AND
SOSUI(6-8)
TMwindows(7)
OR
SOSUI(7)
Sensitivity 99.4% 99.8% 99.9% 99.9%
Specificity 96.6% 70.0% 48.4% 20.0%
トップに戻る

2.6 G-protein

データ名 G-protein
データ内容の説明 G-proteinのカップリングの有無に関する情報が格納されています。
データファイル sevens_gprotein.zip (705B)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
ID 遺伝子名
Coupling G蛋白質とのカップリング(0がカップリングしない、1がカップリングする) 左から順に、Gi/o、Gq/11、Gs、G12/13
トップに戻る

2.7 Ligand

データ名 Ligand
データ内容の説明 GPCRに対するリガンドに関する分子量などの情報を格納しています。
データファイル sevens_ligand.zip (3.09KB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
ID 遺伝子名
Number 連番
Ligand リガンド
Molecular Weight リガンド分子量
トップに戻る

2.8 NCBI nr-aa BLAST

データ名 NCBI nr-aa BLAST
データ内容の説明 NCBI non-redundant配列(nr.aa)との相同性検索の結果を格納してます。
データファイル sevens_nr.zip (26.8MB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
ID 遺伝子名
Number 連番
Leftend 遺伝子の左末端
Rightend 遺伝子の右末端
Name 名称
GI gi番号
E-Value E-value
Identity identity
トップに戻る

2.9 PDB

データ名 PDB
データ内容の説明 PDBと対応する遺伝子リストを格納しています。
データファイル sevens_pdb.zip (16.0KB)

データファイルの各列のデータは以下の通りです。
項目名 項目の説明
ID 遺伝子名
Number 連番
Leftend 遺伝子の左末端
Rightend 遺伝子の右末端
Pdb list PDBリスト
Information list インフォメーションリスト
トップに戻る

2.10 Pseudo gene

データ名 Pseudo gene
データ内容の説明 解析の結果、Pseudo geneと判定された遺伝子の情報(フレームシフトなど)を格納しています。
データファイル sevens_pseudo.zip (168KB)

データファイルの各列のデータは以下の通りです。
ID 遺伝子名
Number 連番
Position フレームシフト/ストップコドンのある残基位置
Kind 種類 (INS/STOP/DEL)
トップに戻る

2.11 Amino acid frequency

データ名 Amino acid frequency
データ内容の説明 タンパク質中のアミノ酸出現頻度と、疎水性値を格納しています。
データファイル sevens_seqft.zip (2.24MB)

データファイルの各列のデータは以下の通りです。
ID 遺伝子名
Mean hydrophobicity 平均疎水性値(Kyte-Doolittleの疎水性値の総和/配列長)
Amino acid appear frequently アミノ酸出現頻度(左から順にGPCAVILMFYWHRKNQEDSTX)
トップに戻る

2.12 Swiss-Prot BLAST

データ名 Swiss-Prot BLAST
データ内容の説明 Swiss-Protとの相同性検索結果を格納しています。
データファイル sevens_swissprot.zip (10.4MB)

データファイルの各列のデータは以下の通りです。
ID 遺伝子名
Number 連番
Leftend 遺伝子の左末端
Rightend 遺伝子の右末端
Name 名称
E-Value E-Value
Identity identity
トップに戻る

2.13 Swiss-Prot Ligand

データ名 Swiss-Prot Ligand
データ内容の説明 Swiss-protとの相同性検索結果からligandに関して抽出したデータ
データファイル sevens_swligand.zip (7.71KB)

データファイルの各列のデータは以下の通りです。
ID 遺伝子名
Number 連番
Swiss-Prot ID Swiss-Prot ID
Ligand リガンド
トップに戻る

2.14 Unigene BLAST

データ名 Unigene BLAST
データ内容の説明 UniGeneとの相同性検索結果を格納しています。
データファイル sevens_unigene.zip (12.5MB)

データファイルの各列のデータは以下の通りです。
ID 遺伝子名
Number 連番
Leftend 遺伝子の左末端
Rightend 遺伝子の右末端
Name 名称
GI gi番号
E-Value E-Value
Identity identity
トップに戻る

3. 本データベースの利用許諾

利用許諾更新日: 2013/09/04

本データベースは、以下で定める利用許諾に基づきご利用いただくことができます。 本利用許諾は、本データベース利用における許諾内容、及び利用者が従うべき条件を定めています。


Creative Commons License

本データベースの利用許諾は、 クリエイティブ・コモンズ 表示-継承2.1 日本の定める利用許諾です。
本データベースのクレジットは、 ”SEVENS © 諏訪牧子 (青山学院大学 理工学部、産業技術総合研究所・生命情報工学研究センター) licensed under CC表示-継承2.1 日本”ですので、 利用にあたり必ず表示してください。

クリエイティブ・コモンズ 表示-継承2.1 日本の概要は こちらです。 具体的な許諾条項は こちらをご覧ください。

本データベースにおいて、以下の条件に従う限り許諾されている事項:

  1. 本データベースの全部または一部に自由にアクセスし、データを取得することができます。
  2. 本データベースの全部または一部のデータを自由に再配布することができます。
  3. 本データベースの全部または一部のデータを利用した、データベースなどの二次的著作物を自由に作成し、配布することができます。

 

本利用許諾に基づいて利用する際に従うべき条件:

  1. 本データベースの全部または一部、あるいは二次的著作物の配布に際しては、本データベースの作成者のクレジットを表示しなければなりません。
  2. 本データベースの全部または一部のデータを利用して作成された二次的著作物は、この利用許諾の下で配布されなければなりません。
  3. 本利用許諾で許諾されていない事項については、以下のデータベース作成者に連絡をとり、利用許諾を求める必要があります。

データベース作成者連絡先:
〒252-5258
神奈川県相模原市中央区淵野辺 5-10-1 J607号室
青山学院大学 理工学部化学・生命科学科 諏訪牧子
E-mail: suwa[at]chem[dot]aoyama[dot]ac[dot]jp

トップに戻る

4. 更新履歴

更新日 更新内容
2014/06/10 生命科学系データベースアーカイブにてダウンロードデータ公開開始
2002/03/29 SEVENS (http://sevens.cbrc.jp/)で公開開始
トップに戻る

5. 参考文献

Ono Y, Fujibuchi W, Suwa M.
Automatic gene collection system for genome-scale overview of G-protein coupled receptors in eukaryotes.
Gene/2005 Dec 30/364:63-73.
PMID:16126348

Suwa M, Ono Y.
Computational overview of GPCR gene universe to support reverse chemical genomics study.
Methods Mol Biol/2009/577:41-54.
PMID:19718507

6. 連絡先

「SEVENS」についてのお問い合わせは、下記連絡先までご連絡ください。

〒252-5258
神奈川県相模原市中央区淵野辺 5-10-1 J607号室
青山学院大学 理工学部化学・生命科学科 諏訪牧子
E-mail: suwa[at]chem[dot]aoyama[dot]ac[dot]jp

トップに戻る