PoSSuM

2019/03/28

Web Site: http://possum.cbrc.jp/PoSSuM/index.html

タンパク質上の低分子結合サイトを推定するためのデータベース

README 目次

  1. ダウンロードデータの構成
  2. ダウンロードデータの説明
  3. 本データベースの利用許諾
  4. 更新履歴
  5. 参考文献
  6. 連絡先

1. ダウンロードデータの構成

  1. README
  2. 既知結合サイト
  3. 未知結合サイト
  4. 既知サイト間相同性データ
  5. サイト間相同性データ
  6. (Drug Search)リガンドリスト
  7. (Drug Search)クエリサイトリスト
  8. (Drug Search)ターゲットサイトリスト
  9. (Drug Search)ターゲットリガンドリスト
  10. (Drug Search)既知サイト間相同性データ
  11. (Drug Search)サイト間相同性データ
トップに戻る

2. ダウンロードデータの説明

2.1 README

データ名 README
データ内容 「PoSSuM」のダウンロードデータについて説明したHTMLファイル。
ダウンロードファイル名 README.html (日本語)
トップに戻る

2.2 既知結合サイト

データ名 既知結合サイト
データ内容の説明

タンパク質上の結合サイトのうち、既知のものの情報です。

データファイル possum_ksite.zip (7.9 MB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
PocketIndex 結合サイトの内部ID
PDB_ID タンパク質のPDB ID
HET_Code 結合するリガンドのHETコード
ChainID 結合サイトのある鎖のID
HET_Res.No. リガンドの残基番号
ResLength サイトの残基数
Atoms リガンドの原子数
MolName サイトの分子名
EC サイトのEC ID
CATH サイトのCATH ID
SCOPe サイトのSCOPe ID
UniProt サイトのUniProt ID
UniRef50 サイトのUniRef50クラスタID(解析当時のもの)
GO1 サイトの分子機能を表すGene Ontology
GO2 サイトの分子機能を表すGene Ontology
GO3 サイトの分子機能を表すGene Ontology
トップに戻る

2.3 未知結合サイト

データ名 未知結合サイト
データ内容の説明

タンパク質上の結合サイトのうち、存在が確認されてはいないが、結合サイトであると推定されたものの情報です。

データファイル possum_psite.zip (27 MB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
PocketIndex 結合サイトの内部ID
PDB_ID タンパク質のPDB ID
HET_Code 結合するリガンドのHETコード
ChainID 結合サイトのある鎖のID
ResLength サイトの残基数
Atoms リガンドの原子数
MolName サイトの分子名
EC サイトのEC ID
CATH サイトのCATH ID
SCOPe サイトのSCOPe ID
UniProt サイトのUniProt ID
UniRef50 サイトのUniRef50クラスタID(解析当時のもの)
GO1 サイトの分子機能を表すGene Ontology
GO2 サイトの分子機能を表すGene Ontology
GO3 サイトの分子機能を表すGene Ontology
トップに戻る

2.4 既知サイト間相同性データ

データ名 既知サイト間相同性データ
データ内容の説明

既知の結合サイト間の相同性を示すデータです。

データファイル possum_kpair.zip (3.9 GB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
Q:PocketIndex クエリサイトの内部ID
T:PocketIndex ターゲットサイトの内部ID
Q:PDB_ID クエリサイトのPDB ID
T:PDB_ID ターゲットサイトのPDB ID
Q:HET_Code クエリサイトのHETコード
T:HET_Code ターゲットサイトのHETコード
Q:ChainID クエリサイトのある鎖のID
T:ChainID ターゲットサイトのある鎖のID
Q:Res.No. クエリサイトのアミノ酸残基番号
T:Res.No. ターゲットサイトのアミノ酸残基番号
Cosine 物理化学・幾何学的な特性で比較したコサイン類似度
AlignedLength アミノ酸アライメント長
RMSD 平均二乗偏差
TM-score タンパク質構造で比較したTemplate modeling score
Pval 類似度のP-Value
AminoIdentity アミノ酸の一致率
MolName サイトの分子名
EC サイトのEC ID
CATH サイトのCATH ID
SCOPe サイトのSCOPe ID
UniProt サイトのUniProt ID
UniRef50 サイトのUniRef50クラスタID(解析当時のもの)
GO1 サイトの分子機能を表すGene Ontology
GO2 サイトの分子機能を表すGene Ontology
GO3 サイトの分子機能を表すGene Ontology
AlignedResidues アミノ酸残基アライメント結果
トップに戻る

2.5 サイト間相同性データ

データ名 サイト間相同性データ
データ内容の説明

既知と未知の結合サイト間の相同性を示すデータです。

データファイル possum_ppair.zip (5.4 GB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
Q:PocketIndex クエリサイトの内部ID
T:PocketIndex ターゲットサイトの内部ID
Q:PDB_ID クエリサイトのPDB ID
T:PDB_ID ターゲットサイトのPDB ID
Q:HET_Code クエリサイトのHETコード
T:HET_Code ターゲットサイトのHETコード
Q:ChainID クエリサイトのある鎖のID
T:ChainID ターゲットサイトのある鎖のID
Q:Res.No. クエリサイトのアミノ酸残基番号
T:Res.No. ターゲットサイトのアミノ酸残基番号
Cosine 物理化学・幾何学的な特性で比較したコサイン類似度
AlignedLength アミノ酸アライメント長
RMSD 平均二乗偏差
TM-score タンパク質構造で比較したTemplate modeling score
Pval 類似度のP-Value
AminoIdentity アミノ酸の一致率
MolName サイトの分子名
EC サイトのEC ID
CATH サイトのCATH ID
SCOPe サイトのSCOPe ID
UniProt サイトのUniProt ID
UniRef50 サイトのUniRef50クラスタID(解析当時のもの)
GO1 サイトの分子機能を表すGene Ontology
GO2 サイトの分子機能を表すGene Ontology
GO3 サイトの分子機能を表すGene Ontology
AlignedResidues アミノ酸残基アライメント結果
トップに戻る

2.6 (Drug Search)リガンドリスト

データ名 (Drug Search)リガンドリスト
データ内容の説明

ChEMBLから抽出した、Drug Searchに適したリガンドのリストです。

データファイル possum_ligand_list.zip (11 KB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
ID リガンドの内部ID
HET_Code リガンドのHETコード
Link Drug Searchの各テーブルへのリンク(簡易検索のみ)
ChEMBL_ID 化合物のChEMBL ID
PrefName よく使われる名称
HeavyAtoms 重原子数
FullMWT 総分子量
Alogp 分配係数ALogPの値
HBA 分子内の水素結合受容基数
HBD 分子内の水素結合供与基数
RotatableBonds 分子内の回転可能な結合数
PSA 分子の極性表面積
ATC_Level1 ATCコードレベル1の分類
ATC_Level2 ATCコードレベル2の分類
ATC_Level3 ATCコードレベル3の分類
ATC_Level4 ATCコードレベル4の分類
トップに戻る

2.7 (Drug Search)クエリサイトリスト

データ名 (Drug Search)クエリサイトリスト
データ内容の説明

(Drug Search)リガンドリストのリガンドに結合するタンパク質上の結合サイト(クエリ)のリストです。

データファイル possum_query_protein.zip (40 KB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
PocketIndex 結合サイトの内部ID
PDB_ID タンパク質のPDB ID
HET_Code 結合するリガンドのHETコード
ChainID 結合サイトのある鎖のID
Res.No. 結合サイトのあるアミノ酸残基の番号
MolName タンパク質の分子名
UniProt タンパク質のUniProt ID
UniRef50 タンパク質のUniRef50クラスタID(解析当時のもの)
EC タンパク質のEC ID
CATH タンパク質のCATH ID
SCOPe タンパク質のSCOPe ID
トップに戻る

2.8 (Drug Search)ターゲットサイトリスト

データ名 (Drug Search)ターゲットサイトリスト
データ内容の説明

クエリサイトに類似した結合サイト(ターゲット)のリストです。

データファイル possum_target_protein.zip (844 KB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
PocketIndex 結合サイトの内部ID
PDB_ID タンパク質のPDB ID
HET_Code 結合するリガンドのHETコード
ChainID 結合サイトのある鎖のID
Res.No. 結合サイトのあるアミノ酸残基の番号
MolName タンパク質の分子名
UniProt タンパク質のUniProt ID
UniRef50 タンパク質のUniRef50クラスタID(解析当時のもの)
EC タンパク質のEC ID
CATH タンパク質のCATH ID
SCOPe タンパク質のSCOPe ID
トップに戻る

2.9 (Drug Search)ターゲットリガンドリスト

データ名 (Drug Search)ターゲットリガンドリスト
データ内容の説明

ターゲットサイトとそれに結合するリガンドのリストです。

データファイル possum_target_ligand.zip (792 KB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
HET_Code リガンドのHETコード
SimilarPockets リガンドに結合するターゲットサイトの内部ID
JaccardIndex(MACCS) リガンドとターゲットサイトのJaccard係数(MACCSによる)
JaccardIndex(FP2) リガンドとターゲットサイトのJaccard係数(FP2による)
InChi_Key 結合部位分子のInChIKey表示
CanonicalSmiles 結合部位分子の正準化SMILES表示
トップに戻る

2.10 (Drug Search)既知サイト間相同性データ

データ名 (Drug Search)既知サイト間相同性データ
データ内容の説明

(Drug Search)クエリサイトとターゲットサイトの中で、既知の結合サイト間の相同性を示すデータです。

データファイル possum_binding_sites_known_similarity.zip (2.4 MB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
Q:PocketIndex クエリサイトの内部ID
T:PocketIndex ターゲットサイトの内部ID
Q:PDB_ID クエリサイトのPDB ID
T:PDB_ID ターゲットサイトのPDB ID
Q:HET_Code クエリサイトのHETコード
T:HET_Code ターゲットサイトのHETコード
Q:ChainID クエリサイトのある鎖のID
T:ChainID ターゲットサイトのある鎖のID
Q:Res.No. クエリサイトのアミノ酸残基番号
T:Res.No. ターゲットサイトのアミノ酸残基番号
AlignedLength アミノ酸アライメント長
RMSD 平均二乗偏差
AminoIdentity アミノ酸の一致率
Q:MolName クエリの分子名
T:MolName ターゲットの分子名
Q:EC クエリのEC ID
T:EC ターゲットのEC ID
Q:CATH クエリのCATH ID
T:CATH ターゲットのCATH ID
Q:SCOPe クエリのSCOPe ID
T:SCOPe ターゲットのSCOPe ID
Q:UniProt クエリのUniProt ID
T:UniProt ターゲットのUniProt ID
Q:UniRef50 クエリのUniRef50クラスタID(解析当時のもの)
T:UniRef50 ターゲットのUniRef50クラスタID(解析当時のもの)
EC_Df クエリとターゲットのEC IDの差異の有無
CATH_Df クエリとターゲットのCATH IDの差異の有無
SCOPe_Df クエリとターゲットのSCOPe IDの差異の有無
ChEMBL_Assay ChEMBLのAssay情報の有無
AlignedResidues アミノ酸残基アライメント結果
トップに戻る

2.11 (Drug Search)サイト間相同性データ

データ名 (Drug Search)サイト間相同性データ
データ内容の説明

(Drug Search)クエリサイトとターゲットサイトの中で、既知と未知の結合サイト間の相同性を示すデータです。

データファイル possum_binding_sites_putative_similarity.zip (5 MB)

データファイルの各列のデータは以下の通りです。
項目名項目の説明
Q:PocketIndex クエリサイトの内部ID
T:PocketIndex ターゲットサイトの内部ID
Q:PDB_ID クエリサイトのPDB ID
T:PDB_ID ターゲットサイトのPDB ID
Q:HET_Code クエリサイトのHETコード
T:HET_Code ターゲットサイトのHETコード
Q:ChainID クエリサイトのある鎖のID
T:ChainID ターゲットサイトのある鎖のID
Q:Res.No. クエリサイトのアミノ酸残基番号
T:Res.No. ターゲットサイトのアミノ酸残基番号
AlignedLength アミノ酸アライメント長
RMSD 平均二乗偏差
AminoIdentity アミノ酸の一致率
Q:MolName クエリの分子名
T:MolName ターゲットの分子名
Q:EC クエリのEC ID
T:EC ターゲットのEC ID
Q:CATH クエリのCATH ID
T:CATH ターゲットのCATH ID
Q:SCOPe クエリのSCOPe ID
T:SCOPe ターゲットのSCOPe ID
Q:UniProt クエリのUniProt ID
T:UniProt ターゲットのUniProt ID
Q:UniRef50 クエリのUniRef50クラスタID(解析当時のもの)
T:UniRef50 ターゲットのUniRef50クラスタID(解析当時のもの)
EC_Df クエリとターゲットのEC IDの差異の有無
CATH_Df クエリとターゲットのCATH IDの差異の有無
SCOPe_Df クエリとターゲットのSCOPe IDの差異の有無
ChEMBL_Assay ChEMBLのAssay情報の有無
AlignedResidues アミノ酸残基アライメント結果
トップに戻る

3. 本データベースの利用許諾

利用許諾更新日: 2019/03/28

本データベースは、以下で定める利用許諾に基づきご利用いただくことができます。 本利用許諾は、本データベース利用における許諾内容、及び利用者が従うべき条件を定めています。


Creative Commons License

本データベースの利用許諾は、 クリエイティブ・コモンズ 表示-継承4.0 国際の定める利用許諾です。
本データベースのクレジットは、 ”PoSSuM © 産業技術総合研究所 臨海副都心センター licensed under CC表示-継承4.0 国際”ですので、 利用にあたり必ず表示してください。

クリエイティブ・コモンズ 表示-継承4.0 国際の概要は こちらです。 具体的な許諾条項は こちらをご覧ください。

本データベースにおいて、以下の条件に従う限り許諾されている事項:

  1. 本データベースの全部または一部に自由にアクセスし、データを取得することができます。
  2. 本データベースの全部または一部のデータを自由に再配布することができます。
  3. 本データベースの全部または一部のデータを利用した、データベースなどの翻案物を自由に作成し、配布することができます。

 

本利用許諾に基づいて利用する際に従うべき条件:

  1. 本データベースの全部または一部、あるいは翻案物の配布に際しては、本データベースの作成者のクレジットを表示しなければなりません。
  2. 本データベースの全部または一部のデータを利用して作成された翻案物は、CC表示-継承4.0(もしくは、それ以降のバージョン)、またはCC表示-継承互換ライセンス(リストはこちら)の下で配布されなければなりません。
  3. 本利用許諾で許諾されていない事項については、以下のデータベース作成者に連絡をとり、利用許諾を求める必要があります。

〒135-0064 東京都江東区青海2-4-7
国立研究開発法人 産業技術総合研究所臨海副都心センター
富井健太郎

E-mail: k-tomii[at]aist[dot]go[dot]jp

トップに戻る

4. 更新履歴

更新日更新内容
2019/03/28 生命科学系データベースアーカイブにてダウンロードデータ公開開始
2011/11/01 PoSSuM (http://possum.cbrc.jp/PoSSuM/index.html) で公開開始
トップに戻る

5. 参考文献

Ito J, Ikeda K, Yamada K, Mizuguchi K, Tomii K.
PoSSuM v.2.0: data update and a new function for investigating ligand analogs and target proteins of small-molecule drugs.
Nucleic Acids Res. DB issue 2015;43:D392-8.
PMID: 25404129

Ito J, Tabei Y, Shimizu K, Tsuda K, Tomii K.
PoSSuM: a database of similar protein-ligand binding and putative pockets.
Nucleic Acids Res. DB issue 2012;40:D541-8.
PMID: 22135290

Ito J, Tabei Y, Shimizu K, Tomii K, Tsuda K.
PDB-Scale analysis of known and putative ligand binding sites with structural sketches.
Proteins 2011;80:747-63.
PMID: 22113700

Tabei Y, Uno T, Sugiyama M, Tsuda K.
Single Versus Multiple Sorting for All Pairs Similarity Search.
The 2nd Asian Conference on Machine Learning (ACML2010) 2010.

トップに戻る

6. 連絡先

「PoSSuM」についてのお問い合わせは、下記連絡先までご連絡ください。

〒135-0064 東京都江東区青海2-4-7
国立研究開発法人 産業技術総合研究所臨海副都心センター
富井健太郎

E-mail: k-tomii[at]aist[dot]go[dot]jp

トップに戻る