- あのデータベースが、丸ごとダウンロード可能に!-
[ Japanese | English ]
このデータベースについて

Cluster (緑色植物)

データ説明
データ名
Cluster (緑色植物)
DOI
10.18908/lsdba.nbdc01194-02-002.V002
バージョン
V2 10.18908/lsdba.nbdc01194-02-002.V002 更新履歴
V1 10.18908/lsdba.nbdc01194-02-002.V001 -
データ内容の説明
NCBI Reference Sequenceデータベースから取得した緑色植物のアミノ酸配列を配列間のBLASTによる網羅的なホモロジー情報に基づいて各系統群ごとにクラスタリ ングしたデータ。各系統群では1つのアミノ酸配列は必ず1つのクラスターに所属する。
データファイル
データファイル名 :
pgdbj_ortholog_db_viridiplantae_cluster.zip
データのURL :
ファイルサイズ :
16.6 MB
簡易検索URL
http://togodb.biosciencedbc.jp/togodb/view/pgdbj_ortholog_db_viridiplantae_cluster
データ取得方法

Protein (緑色植物)のデータを使用。

解析方法

NCBI Taxonomyデータベースから取得した生物種間の系統関係を遡る方向に下位系統群でのクラスター(subcluster)を併合して上位系統群でのク ラスター(supercluster)を再帰的に生成している。

データ件数

2,310,444 件

データ詳細
項目名 項目の説明
Cluster ID

オルソログクラスターに付けられるID 各系統群でのオルソログクラスタは0からの通し番号(「クラスターID」)を付けて管理されている。異なった系統群での「クラスターID」を区別するためにTaxonomy IDを":"(コロン)で繋げて管理する。例えば、Taxonomy IDが"33090"の系統群の0番目の「クラスターID」は"33090:0"となる。「クラスターID」は「オルソログDB」が独自に付けているものである。

Cluster size

クラスターに所属するアミノ酸配列数

Supercluster

1つ上位の系統群でのクラスターID

Subcluster

1つ下位の系統群でのクラスターID