- あのデータベースが、丸ごとダウンロード可能に!-

生命科学系データベースアーカイブ
Gclust Server

TogoDB版 Gclust Serverの使用方法

このページでは、TogoDB版Gclust Serverの使用方法について説明しています。

生物グループによる絞り込み検索

Gclust Serverでは、95種の生物種が6つの生物グループに分類されています。 TogoDB版のGclust Serverでは、クラスターに含まれるその生物種グループの生物種の割合から 検索を行うことができます。

検索手順

検索例:"Plants and algae"のグループの生物種で、グループの生物種数に対して、 50%以上の生物種が存在するクラスターの検索
  1. Gclust Server - Cluster List (http://togodb.biosciencedbc.jp/togodb/view/gclust_cluster)を表示します。
  2. TogoDBのAdvanced Searchを表示します。
  3. "Plants and algae (7species) (%)"の検索フォームに「>=50」を入力します。
    これは、Plantに含まれる生物種数の7種中4種以上の生物が含まれるクラスターを検索する、ということを意味します。
  4. "Advanced Search"の[Search]ボタンをクリックします。
    ※注) 基本検索の[Search]ボタンをクリックしますと、基本検索のフォームに入力された キーワードで検索されます。
複数の生物グループで検索は、上記と同様に生物グループのカラムの検索フォームに 値を入力することで検索を行うことができます。

特定の生物種を含むクラスターの検索

Cluster Listには、"Number of Sequences for each species"(クラスターに含まれる生物種毎の配列数)の データ項目がありますが、これを利用して、特定の生物種の配列が含まれるクラスターを検索することができます。

検索手順

検索例:Arabidopsis thaliana(ATH)、Homo sapiens(HSA)のアミノ酸配列が属するクラスターの検索。
  1. Gclust Server - Cluster List (http://togodb.biosciencedbc.jp/togodb/view/gclust_cluster)を表示します。
  2. TogoDBのAdvanced Searchを表示します。
  3. "Number of Sequences for each species"の検索フォームに下記の正規表現を入力します。 Gclust Serverでは生物種名は略称で記述されているので、略称を使った検索になります。 略称と生物種名の対応については、「生物グループ、生物種の略称と生物種名の対応表」をご参照ください。
      /ATH.+HSA/ 
  4. "Advanced Search"の[Search]ボタンをクリックします。
    ※注意: 基本検索の[Search]ボタンをクリックしますと、基本検索のフォームに入力されたキーワードで検索されます。

検索時の注意事項

この検索では、TogoDBの正規表現による検索機能を利用しています。 "Number of Sequences for each species"のカラムのデータに記載される生物種名の略称の順番は規定されています。 複数の生物種で検索する場合、生物種の順番を考慮する必要があります。 上記の検索例の場合、「/HSA.+ATH/」のように順番を入れ替えると、意図した通りの検索を行うことはできません。 記載順は、下記の 「生物グループ、生物種の略称と生物種名の対応表」に記載されている順番と同様です。


特定の生物種を含まないクラスターの検索

Cluster Listには、"Species not appearing in this cluster"(クラスターに含まれなかった生物種)の データ項目がありますが、これを利用して、特定の生物種の配列が含まれるクラスターを検索することができます。

検索手順

検索例:Oryza sativa(OSA)、Drosophila melanogaster(DME)のアミノ酸配列が属さないクラスターの検索。
  1. Gclust Server - Cluster List (http://togodb.biosciencedbc.jp/togodb/view/gclust_cluster)を表示します。
  2. TogoDBのAdvanced Searchを表示します。
  3. "Species not appearing in this cluster"の検索フォームに下記の正規表現を入力します。 Gclust Serverでは生物種名は略称で記述されているので、略称を使った検索になります。 略称と生物種名の対応については、「生物グループ、生物種の略称と生物種名の対応表」をご参照ください。
      /OSA.+DME/ 
  4. "Advanced Search"の[Search]ボタンをクリックします。
    ※注意: 基本検索の[Search]ボタンをクリックしますと、基本検索のフォームに入力されたキーワードで検索されます。

検索時の注意事項

この検索では、TogoDBの正規表現による検索機能を利用しています。 "Species not appearing in this cluster"のカラムのデータに記載される生物種名の略称の順番は規定されています。 複数の生物種で検索する場合、生物種の順番を考慮する必要があります。 上記の検索例の場合、「/DME.+OSA/」のように順番を入れ替えても、意図した通りの検索を行うことはできません。 記載順は、下記の 「生物グループ、生物種の略称と生物種名の対応表」に記載されている順番と同様です。


生物グループ、生物種の略称と生物種名の対応表

生物グループと各グループに属する生物種
生物グループ 生物グループに含まれる生物種
Plants (Plants and algae) ATH (Arabidopsis thaliana ),
CME (Cyanidioschyzon merolae),
CRE (Chlamydomonas reinhardtii),
OSA (Oryza sativa),
OTAU (Ostreococcus tauri),
PPT (Physcomitrella patens),
PoTR (Populus tricocarpa)
OtherBikonts
(Bikonts (Chromalveolata, Excavata))
DPTM (Paramecium tetraurelia),
GTH (Guillardia theta),
NGR (Naegleria gruberi),
PFA (Plasmodium falciparum),
PHRA (Phytophthora ramorum),
PHSO (Phytophthora sojae),
PTR (Phaeodactylum tricornutum),
TET (Tetrahymena thermophila SB210),
TPS (Thalassiosira pseudonana)
Cyano (Cyanobacteria) Ana (Anabaena sp. PCC 7120),
Ava (Anabaena variabilis ATCC 29413),
Glv (Gloeobacter violaceus),
Npun (Nostoc punctiforme sp. PCC73102),
Pm1 (Prochlorococcus marinus MED4),
Pm2 (Prochlorococcus marinus MIT9313),
Pm3 (Prochlorococcus marinus SS120),
Pm4 (Prochlorococcus marinus MIT9312),
Pm5 (Prochlorococcus marinus NATL2A),
Pm6 (Prochlorococcus marinus MIT9301),
Pm7 (Prochlorococcus marinus MIT9303),
Pm8 (Prochlorococcus marinus MIT9315),
Pm9 (Prochlorococcus marinus NATL1A),
PmA (Prochlorococcus marinus AS9601),
S63 (Synechococcus sp. PCC 6301),
S79 (Synechococcus sp. PCC 7942),
S81 (Synechococcus sp. WH8102),
S93 (Synechococcus sp. CC9311),
S96 (Synechococcus sp. CC9605),
S99 (Synechococcus sp. CC9902),
Syn (Synechocystis sp. PCC 6803),
Tel (Thermosynechococcus elongatus),
Ter (Trichodesmium erythraeum 405 1),
YelA (Cyanobacterium Yellowstone A-prime),
YelB (Cyanobacterium Yellowstone B-prime)
PhotoBact (Photosynthetic bacteria) Caur (Chloroflexus aurantiacus),
Cch (Chlorobium chlorochromatii CaD3),
Clim (Chlorobium limicola DSM 245),
Cph (Chlorobium phaeobacteroides DSM 266),
Ctep (Clorobium tepidum),
Pvi (Prostheocochloris vibrioformis DSM 265),
Rde (Roseobacter denitrificans Och 114),
Rpa1 (Rhodopseudomonas plustris BisA53),
Rpa2 (Rhodopseudomonas plustris BisB4),
Rpa3 (Rhodopseudomonas plustris BisB18),
Rpa4 (Rhodopseudomonas plustris HaA2),
Rpal (Rhodopsudomonas palustris),
Rrub (Rhodospirillum rubrum ATCC 11170),
Rsh (Rhodobacter sphaeroides ATCC 17029),
Rsp (Rhodobacter sphaeroides 2.4.1)]
OtherBact (Non-photosynthetic bacteria) Caur (Chloroflexus aurantiacus),
Cch (Chlorobium chlorochromatii CaD3),
Clim (Chlorobium limicola DSM 245),
Afu (Archaeoglobus fulgidus DSM 4304),
Ape (Aeropyrum pernix K1),
Atu (Agrobacterium tumefaciens str. C58),
Bja (Bradyrhizobium japonicum USDA 110),
Bma (Burkholderia mallei ATCC 23344),
Bms (Brucella suis 1330),
Bpe (Bordetella pertussis Tohama I),
Bsu (Bacillus subtilis Marburg 168),
Ccr (Caulobacter crescentus CB15),
Cvi (Chromobacterium violaceum ATCC 12472),
Eba (Azoarcus sp EbN1 ),
Eco (Escherichia coli K-12),
Fal (Frankia alni ACN14a),
Fra (Frankia sp. CcI3),
Gox (Gluconobacter_oxydans_621H),
Hal (Halobacterium sp. NRC-1),
Mac (Methanosarcina acetivorans str. C2A),
Mes (Mesorhizobium sp. BNC1),
Mlo (Mesorhizobium loti MAFF303099),
Mtu (Mycobacterium tuberculosis H37Rv),
Neq (Nanoarchaeum equitans Kin4-M),
Pho (Pyrococcus horikoshii OT3),
Pst (Pseudomonas syringae pv. tomato str. DC3000),
Rhe (Rhizobium_etli_CFN_42),
Rle (Rhizobium leguminosarum),
Rso (Ralstonia solanacearum GMI1000),
Sco (Streptomyces coelicolor A3(2)),
Sep (Staphylococcus epidermidis ATCC 12228),
Sme (Sinorhizobium meliloti 1021),
Sto (Sulfolobus tokodaii str. 7),
Vvy (Vibrio vulnificus YJ016)
Opistokonts (Animals and fungi) CEL (Caenorhabditis elegans),
DCGR (Candida glabrata CBS138),
DKLA (Kluyveromyces lactis NRRL Y-1140),
DME (Drosophila melanogaster),
HSA (Homo sapiens),
NCR (Neurospora crassa 74-OR23-1A),
SCE (Saccharomyces cerevisiae),
SPO (Schyzosaccharomyces pombe),
※生物種の表示順は、"Number of Sequences for each species"や"Species not appearing in this cluster"の項目で 表示される順番と同じです。