- あのデータベースが、丸ごとダウンロード可能に!-
[ Japanese | English ]
データのメタデータ一覧
全 696 件 (206件から210件)
件を表示 詳細検索
データ名 データベース名 DOI 説明 データファイル 簡易検索URL データ取得方法 解析方法 データ件数 データ詳細
生物グループの設定 Gclust Server 10.18908/lsdba.nbdc00464-007

95種の生物をグループ分けした定義が記載されている。先頭行に生物種の数、最後の行に「//END」が記載され、 #で始まる行はコメント行である。タブ区切りテキスト形式ファイル。

grp_def1
(1KB)
-

-

-

-
データ詳細 open_in_full
生物グループ分けのパラメータ Gclust Server 10.18908/lsdba.nbdc00464-008

生物グループに割り当てられる際の、各生物グループの生物種数に占める相同性を示した生物種の数の割合の閾値を設定したファイル。 例えば、設定値が0.5の場合、"Plants"のグループの中で7種の生物中、4種以上の生物種の配列がクラスター内に存在する際に、 その生物グループにあるとされる。

pat_def1
(1KB)
-

-

-

-
データ詳細 open_in_full
生物毎の接頭語リスト Gclust Server 10.18908/lsdba.nbdc00464-006

Gclustで使用される生物の接頭語のリスト。接頭語は配列IDの先頭に、各生物に対応して付けられる。 先頭行に生物種の数(95)、2行目以降は各生物の接頭語が一行ずつ記載され、 最後の行に「//END」が記載される。テキスト形式ファイル。

prefix_all95
(1KB)
-

-

-

-
データ詳細 open_in_full
配列IDとアノテーション情報 Gclust Server 10.18908/lsdba.nbdc00464-005

95生物種の予測されたタンパク質のアミノ酸配列のID、長さ、アノテーション情報を記した タブ区切りテキストファイル。

all95.p.table.zip
(7.28MB)
-

-

-

-
データ詳細 open_in_full
95生物種のタンパク質アミノ酸配列間の類似度比較に基づくクラスター Gclust Server 10.18908/lsdba.nbdc00464-002

本データベース中のアミノ酸配列データを総当たりでBLASTP検索し、E-valueとオーバーラップスコア(相同な領域の割合)をクラスタリングの条件として用い、 クラスター毎に最適なE-valueとオーバーラップスコアの領域を求める方法 (Bioinformatics 2009 Mar 1;25(5):599-605.) でクラスタリングを行った。 CSV形式のテキストファイル。

gclust_cluster.zip
(8.72MB)
http://togodb.biosciencedbc.jp/togodb/view/gclust_cluster

本データベース中の配列データ

-

206,764件
データ詳細 open_in_full
データ名 データベース名 DOI 説明 データファイル 簡易検索URL データ取得方法 解析方法 データ件数 データ詳細