データのメタデータ一覧
| データ名 ⇅ | データベース名 ⇅ | DOI ⇅ | 説明 ⇅ | データファイル ⇅ | 簡易検索URL ⇅ | データ取得方法 ⇅ | 解析方法 ⇅ | データ件数 ⇅ | データ詳細 |
|---|---|---|---|---|---|---|---|---|---|
| 生物グループの設定 | Gclust Server | 10.18908/lsdba.nbdc00464-007 |
95種の生物をグループ分けした定義が記載されている。先頭行に生物種の数、最後の行に「//END」が記載され、 #で始まる行はコメント行である。タブ区切りテキスト形式ファイル。 |
grp_def1
(1KB) |
- |
- |
- |
- |
データ詳細
open_in_full
|
| 生物グループ分けのパラメータ | Gclust Server | 10.18908/lsdba.nbdc00464-008 |
生物グループに割り当てられる際の、各生物グループの生物種数に占める相同性を示した生物種の数の割合の閾値を設定したファイル。 例えば、設定値が0.5の場合、"Plants"のグループの中で7種の生物中、4種以上の生物種の配列がクラスター内に存在する際に、 その生物グループにあるとされる。 |
pat_def1
(1KB) |
- |
- |
- |
- |
データ詳細
open_in_full
|
| 生物毎の接頭語リスト | Gclust Server | 10.18908/lsdba.nbdc00464-006 |
Gclustで使用される生物の接頭語のリスト。接頭語は配列IDの先頭に、各生物に対応して付けられる。 先頭行に生物種の数(95)、2行目以降は各生物の接頭語が一行ずつ記載され、 最後の行に「//END」が記載される。テキスト形式ファイル。 |
prefix_all95
(1KB) |
- |
- |
- |
- |
データ詳細
open_in_full
|
| 配列IDとアノテーション情報 | Gclust Server | 10.18908/lsdba.nbdc00464-005 |
95生物種の予測されたタンパク質のアミノ酸配列のID、長さ、アノテーション情報を記した タブ区切りテキストファイル。 |
all95.p.table.zip
(7.28MB) |
- |
- |
- |
- |
データ詳細
open_in_full
|
| 95生物種のタンパク質アミノ酸配列間の類似度比較に基づくクラスター | Gclust Server | 10.18908/lsdba.nbdc00464-002 |
本データベース中のアミノ酸配列データを総当たりでBLASTP検索し、E-valueとオーバーラップスコア(相同な領域の割合)をクラスタリングの条件として用い、 クラスター毎に最適なE-valueとオーバーラップスコアの領域を求める方法 (Bioinformatics 2009 Mar 1;25(5):599-605.) でクラスタリングを行った。 CSV形式のテキストファイル。 |
gclust_cluster.zip
(8.72MB) |
http://togodb.biosciencedbc.jp/togodb/view/gclust_cluster |
本データベース中の配列データ |
- |
206,764件 |
データ詳細
open_in_full
|
| データ名 | データベース名 | DOI | 説明 | データファイル | 簡易検索URL | データ取得方法 | 解析方法 | データ件数 | データ詳細 |