- あのデータベースが、丸ごとダウンロード可能に!-
[ Japanese | English ]
データのメタデータ一覧
全 696 件 (471件から475件)
件を表示 詳細検索
データ名 データベース名 DOI 説明 データファイル 簡易検索URL データ取得方法 解析方法 データ件数 データ詳細
OpenPMLサイトデータ OpenPML 10.18908/lsdba.nbdc01204-001

OpenPMLのWebサイトをアーカイブしたものです。index.htmlファイルから全体が見られます。
 

openpml.zip
(533 KB)
-

-

-

-
データ詳細 open_in_full
タンパク質相互作用 PCDq 10.18908/lsdba.nbdc01200-003

タンパク質相互作用に関する情報。
DIPについては、データ再配布についてDIP開発者から許可をいただきました。ここに記して感謝の意を表します。

pcdq_public_ppi.zip
(680 KB)
http://togodb.biosciencedbc.jp/togodb/view/pcdq_public_ppi

タンパク質間相互作用データは BIND, DIP, MINT, HPRD, IntAct, および GNP_Y2H の6つのデータベースから取得しました。

データベースから取得したタンパク質間相互作用データを統合し、タンパク質とタンパク質間相互作用データセットを作成しました。収集したタンパク質間相互作用データから非冗長なタンパク質間相互作用データセットを作成するため、 タンパク質のAccession No. (UniProt, RefSeq, GI, GenBank ID)からアミノ酸配列を取得し、 すべての配列について生物種ごとに同一相同性クラスタリング (95%以上の領域において、98%以上の相同性を持つタンパク質同士のグループ化)を行って、冗長性を取り除きました。 非冗長な統合タンパク質間相互作用データセットのうち、 ヒトのタンパク質間相互作用情報をH-InvDBのタンパク質セットに割り当てた結果、 9,268件のタンパク質からなる32,198件のヒトのタンパク質間相互作用情報が得られました。

32,198 件
データ詳細 open_in_full
タンパク質複合体メンバー PCDq 10.18908/lsdba.nbdc01200-002

複合体に属するタンパク質の情報

pcdq_subunit_member.zip
(673 KB)
http://togodb.biosciencedbc.jp/togodb/view/pcdq_subunit_member

タンパク質情報はH-InvDBのものを使いました。相互作用データについては「タンパク質相互作用」のものを用いました。遺伝子発現データについてはH-AngelのiAFLP data (JBIRC)を用いました。

H-InvDBでは、ヒト転写産物(cDNA, mRNA, RNA)の塩基配列を解析対象として、タンパク質データベースに対して配列相同性検索プログラム(FASTY・BlastX)を実行し、配列の類似性およびGeneMarkによる遺伝子予測結果との組み合わせにより転写産物配列中でタンパク質をコードしている領域(CDS)を予測しています。
ゲノム上の重複を除いて定義されるクラスター(遺伝子座)の代表的な配列を代表配列 (rep_HIP)と定義しました。代表配列は、それぞれのクラスターメンバーを考慮して手動アノテーションで定義しています。
予測されたアミノ酸配列に対しモチーフ予測プログラム(InterProScan)を実行しタンパク質の機能予測を行った後、手動アノテーションを行いました。既知タンパク質または機能性モチーフ情報を用いて、タンパク質情報の信頼度におけるカテゴリ分けを行っています (HIT_category)。また、複合体タンパク質としての信頼度によるカテゴリー分けも行いました(Category)。

5,569 件
データ詳細 open_in_full
タンパク質複合体リスト PCDq 10.18908/lsdba.nbdc01200-001

タンパク質複合体の情報

pcdq_complex_list.zip
(136 KB)
http://togodb.biosciencedbc.jp/togodb/view/pcdq_complex_list

タンパク質間相互作用データについては 「タンパク質相互作用」に記述したデータを用いました。既知の複合体情報は、文献情報、構造解析結果を人の手によって調べました。

データベースから取得したタンパク質間相互作用データを統合し、タンパク質とタンパク質間相互作用データセットを作成しました (2007年11月)。 これらから形成されるPPIネットワークから、タンパク質複合体/機能単位の予測を行いました。 そのすべての予測結果について、人手による既知の複合体情報との照合、情報の付加・修正を行いました。

1,266 件
データ詳細 open_in_full
Cluster (ラン藻) PGDBj - オルソログデータベース 10.18908/lsdba.nbdc01194-02-005.v002

NCBI Reference Sequenceデータベースから取得したラン藻のアミノ酸配列を配列間のBLASTによる網羅的なホモロジー情報に基づいて各系統群ごとにクラスタリングしたデータ。各系統群では1つのアミノ酸配列は必ず1つのクラスターに所属する。

pgdbj_ortholog_db_cyanobacteria_cluster.zip
(8.2 MB)
http://togodb.biosciencedbc.jp/togodb/view/pgdbj_ortholog_db_cyanobacteria_cluster

Protein (ラン藻)のデータを使用。

NCBI Taxonomyデータベースから取得した生物種間の系統関係を遡る方向に下位系統群でのクラスター(subcluster)を併合して上位系統群でのク ラスター(supercluster)を再帰的に生成している。

1,095,715 件
データ詳細 open_in_full
データ名 データベース名 DOI 説明 データファイル 簡易検索URL データ取得方法 解析方法 データ件数 データ詳細