- あのデータベースが、丸ごとダウンロード可能に!-
[ Japanese | English ]
このデータベースについて

95生物種のタンパク質アミノ酸配列間の類似度比較に基づくクラスター

データ説明
データ名
95生物種のタンパク質アミノ酸配列間の類似度比較に基づくクラスター
DOI
10.18908/lsdba.nbdc00464-002
データ内容の説明
本データベース中のアミノ酸配列データを総当たりでBLASTP検索し、E-valueとオーバーラップスコア(相同な領域の割合)をクラスタリングの条件として用い、 クラスター毎に最適なE-valueとオーバーラップスコアの領域を求める方法 (<a href="http://gclust.c.u-tokyo.ac.jp/" rel="external">Bioinformatics 2009 Mar 1;25(5):599-605.</a>) でクラスタリングを行った。 CSV形式のテキストファイル。
データファイル
データファイル名 :
gclust_cluster.zip
データのURL :
ファイルサイズ :
8.72MB
簡易検索URL
http://togodb.biosciencedbc.jp/togodb/view/gclust_cluster
データ取得方法

本データベース中の配列データ

解析方法

-

データ件数

206,764件

データ詳細
項目名 項目の説明
Cluster ID

-

Representative sequence ID

-

Link to cluster sequences

-

Link to related sequences

-

Sequence length

-

Representative annotation

-

Number of Sequences

-

Homologs

-

Clustering threshold

-

Plants (7species) (%)

-

Other bikonts (9species) (%)

-

Cyano (25species) (%)

-

Photo Bact (15species) (%)

-

Other Bact (31species) (%)

-

Opisthokonts (8species) (%)

-

Number of Sequences for each species

-

Species not appearing in this cluster

-