データ一覧 | LSDBアーカイブ

データのメタデータ一覧

全 696 件 (206件から210件)

件を表示詳細検索

データ名 ⇅	データベース名 ⇅	DOI ⇅	説明 ⇅	データファイル ⇅	簡易検索URL ⇅	データ取得方法 ⇅	解析方法 ⇅	データ件数 ⇅	データ詳細
生物グループの設定	Gclust Server	10.18908/lsdba.nbdc00464-007	95種の生物をグループ分けした定義が記載されている。先頭行に生物種の数、最後の行に「//END」が記載され、 #で始まる行はコメント行である。タブ区切りテキスト形式ファイル。	grp_def1 (1KB)	-	-	-	-	データ詳細 open_in_full
生物グループ分けのパラメータ	Gclust Server	10.18908/lsdba.nbdc00464-008	生物グループに割り当てられる際の、各生物グループの生物種数に占める相同性を示した生物種の数の割合の閾値を設定したファイル。例えば、設定値が0.5の場合、"Plants"のグループの中で7種の生物中、4種以上の生物種の配列がクラスター内に存在する際に、その生物グループにあるとされる。	pat_def1 (1KB)	-	-	-	-	データ詳細 open_in_full
生物毎の接頭語リスト	Gclust Server	10.18908/lsdba.nbdc00464-006	Gclustで使用される生物の接頭語のリスト。接頭語は配列IDの先頭に、各生物に対応して付けられる。先頭行に生物種の数(95)、2行目以降は各生物の接頭語が一行ずつ記載され、最後の行に「//END」が記載される。テキスト形式ファイル。	prefix_all95 (1KB)	-	-	-	-	データ詳細 open_in_full
配列IDとアノテーション情報	Gclust Server	10.18908/lsdba.nbdc00464-005	９５生物種の予測されたタンパク質のアミノ酸配列のID、長さ、アノテーション情報を記したタブ区切りテキストファイル。	all95.p.table.zip (7.28MB)	-	-	-	-	データ詳細 open_in_full
９５生物種のタンパク質アミノ酸配列間の類似度比較に基づくクラスター	Gclust Server	10.18908/lsdba.nbdc00464-002	本データベース中のアミノ酸配列データを総当たりでBLASTP検索し、E-valueとオーバーラップスコア（相同な領域の割合）をクラスタリングの条件として用い、クラスター毎に最適なE-valueとオーバーラップスコアの領域を求める方法（Bioinformatics 2009 Mar 1;25(5):599-605.）でクラスタリングを行った。 CSV形式のテキストファイル。	gclust_cluster.zip (8.72MB)	http://togodb.biosciencedbc.jp/togodb/view/gclust_cluster	本データベース中の配列データ	-	206,764件	データ詳細 open_in_full
データ名	データベース名	DOI	説明	データファイル	簡易検索URL	データ取得方法	解析方法	データ件数	データ詳細