PoSSuM
2019/03/28
Web Site:
http://possum.cbrc.jp/PoSSuM/index.html
タンパク質上の低分子結合サイトを推定するためのデータベース
README 目次
- ダウンロードデータの構成
- ダウンロードデータの説明
- 本データベースの利用許諾
- 更新履歴
- 参考文献
- 連絡先
1. ダウンロードデータの構成
- README
- 既知結合サイト
- 未知結合サイト
- 既知サイト間相同性データ
- サイト間相同性データ
- (Drug Search)リガンドリスト
- (Drug Search)クエリサイトリスト
- (Drug Search)ターゲットサイトリスト
- (Drug Search)ターゲットリガンドリスト
- (Drug Search)既知サイト間相同性データ
- (Drug Search)サイト間相同性データ
2. ダウンロードデータの説明
2.1 README
README |
「PoSSuM」のダウンロードデータについて説明したHTMLファイル。 |
README.html (日本語) |
2.2 既知結合サイト
既知結合サイト |
タンパク質上の結合サイトのうち、既知のものの情報です。 |
possum_ksite.zip (7.9 MB) |
データファイルの各列のデータは以下の通りです。
項目名 | 項目の説明 |
PocketIndex |
結合サイトの内部ID |
PDB_ID |
タンパク質のPDB ID |
HET_Code |
結合するリガンドのHETコード |
ChainID |
結合サイトのある鎖のID |
HET_Res.No. |
リガンドの残基番号 |
ResLength |
サイトの残基数 |
Atoms |
リガンドの原子数 |
MolName |
サイトの分子名 |
EC |
サイトのEC ID |
CATH |
サイトのCATH ID |
SCOPe |
サイトのSCOPe ID |
UniProt |
サイトのUniProt ID |
UniRef50 |
サイトのUniRef50クラスタID(解析当時のもの) |
GO1 |
サイトの分子機能を表すGene Ontology |
GO2 |
サイトの分子機能を表すGene Ontology |
GO3 |
サイトの分子機能を表すGene Ontology |
2.3 未知結合サイト
未知結合サイト |
タンパク質上の結合サイトのうち、存在が確認されてはいないが、結合サイトであると推定されたものの情報です。 |
possum_psite.zip (27 MB) |
データファイルの各列のデータは以下の通りです。
項目名 | 項目の説明 |
PocketIndex |
結合サイトの内部ID |
PDB_ID |
タンパク質のPDB ID |
HET_Code |
結合するリガンドのHETコード |
ChainID |
結合サイトのある鎖のID |
ResLength |
サイトの残基数 |
Atoms |
リガンドの原子数 |
MolName |
サイトの分子名 |
EC |
サイトのEC ID |
CATH |
サイトのCATH ID |
SCOPe |
サイトのSCOPe ID |
UniProt |
サイトのUniProt ID |
UniRef50 |
サイトのUniRef50クラスタID(解析当時のもの) |
GO1 |
サイトの分子機能を表すGene Ontology |
GO2 |
サイトの分子機能を表すGene Ontology |
GO3 |
サイトの分子機能を表すGene Ontology |
2.4 既知サイト間相同性データ
既知サイト間相同性データ |
既知の結合サイト間の相同性を示すデータです。 |
possum_kpair.zip (3.9 GB) |
データファイルの各列のデータは以下の通りです。
項目名 | 項目の説明 |
Q:PocketIndex |
クエリサイトの内部ID |
T:PocketIndex |
ターゲットサイトの内部ID |
Q:PDB_ID |
クエリサイトのPDB ID |
T:PDB_ID |
ターゲットサイトのPDB ID |
Q:HET_Code |
クエリサイトのHETコード |
T:HET_Code |
ターゲットサイトのHETコード |
Q:ChainID |
クエリサイトのある鎖のID |
T:ChainID |
ターゲットサイトのある鎖のID |
Q:Res.No. |
クエリサイトのアミノ酸残基番号 |
T:Res.No. |
ターゲットサイトのアミノ酸残基番号 |
Cosine |
物理化学・幾何学的な特性で比較したコサイン類似度 |
AlignedLength |
アミノ酸アライメント長 |
RMSD |
平均二乗偏差 |
TM-score |
タンパク質構造で比較したTemplate modeling score |
Pval |
類似度のP-Value |
AminoIdentity |
アミノ酸の一致率 |
MolName |
サイトの分子名 |
EC |
サイトのEC ID |
CATH |
サイトのCATH ID |
SCOPe |
サイトのSCOPe ID |
UniProt |
サイトのUniProt ID |
UniRef50 |
サイトのUniRef50クラスタID(解析当時のもの) |
GO1 |
サイトの分子機能を表すGene Ontology |
GO2 |
サイトの分子機能を表すGene Ontology |
GO3 |
サイトの分子機能を表すGene Ontology |
AlignedResidues |
アミノ酸残基アライメント結果 |
2.5 サイト間相同性データ
サイト間相同性データ |
既知と未知の結合サイト間の相同性を示すデータです。 |
possum_ppair.zip (5.4 GB) |
データファイルの各列のデータは以下の通りです。
項目名 | 項目の説明 |
Q:PocketIndex |
クエリサイトの内部ID |
T:PocketIndex |
ターゲットサイトの内部ID |
Q:PDB_ID |
クエリサイトのPDB ID |
T:PDB_ID |
ターゲットサイトのPDB ID |
Q:HET_Code |
クエリサイトのHETコード |
T:HET_Code |
ターゲットサイトのHETコード |
Q:ChainID |
クエリサイトのある鎖のID |
T:ChainID |
ターゲットサイトのある鎖のID |
Q:Res.No. |
クエリサイトのアミノ酸残基番号 |
T:Res.No. |
ターゲットサイトのアミノ酸残基番号 |
Cosine |
物理化学・幾何学的な特性で比較したコサイン類似度 |
AlignedLength |
アミノ酸アライメント長 |
RMSD |
平均二乗偏差 |
TM-score |
タンパク質構造で比較したTemplate modeling score |
Pval |
類似度のP-Value |
AminoIdentity |
アミノ酸の一致率 |
MolName |
サイトの分子名 |
EC |
サイトのEC ID |
CATH |
サイトのCATH ID |
SCOPe |
サイトのSCOPe ID |
UniProt |
サイトのUniProt ID |
UniRef50 |
サイトのUniRef50クラスタID(解析当時のもの) |
GO1 |
サイトの分子機能を表すGene Ontology |
GO2 |
サイトの分子機能を表すGene Ontology |
GO3 |
サイトの分子機能を表すGene Ontology |
AlignedResidues |
アミノ酸残基アライメント結果 |
2.6 (Drug Search)リガンドリスト
(Drug Search)リガンドリスト |
ChEMBLから抽出した、Drug Searchに適したリガンドのリストです。 |
possum_ligand_list.zip (11 KB) |
データファイルの各列のデータは以下の通りです。
項目名 | 項目の説明 |
ID |
リガンドの内部ID |
HET_Code |
リガンドのHETコード |
Link |
Drug Searchの各テーブルへのリンク(簡易検索のみ) |
ChEMBL_ID |
化合物のChEMBL ID |
PrefName |
よく使われる名称 |
HeavyAtoms |
重原子数 |
FullMWT |
総分子量 |
Alogp |
分配係数ALogPの値 |
HBA |
分子内の水素結合受容基数 |
HBD |
分子内の水素結合供与基数 |
RotatableBonds |
分子内の回転可能な結合数 |
PSA |
分子の極性表面積 |
ATC_Level1 |
ATCコードレベル1の分類 |
ATC_Level2 |
ATCコードレベル2の分類 |
ATC_Level3 |
ATCコードレベル3の分類 |
ATC_Level4 |
ATCコードレベル4の分類 |
2.7 (Drug Search)クエリサイトリスト
(Drug Search)クエリサイトリスト |
(Drug Search)リガンドリストのリガンドに結合するタンパク質上の結合サイト(クエリ)のリストです。 |
possum_query_protein.zip (40 KB) |
データファイルの各列のデータは以下の通りです。
項目名 | 項目の説明 |
PocketIndex |
結合サイトの内部ID |
PDB_ID |
タンパク質のPDB ID |
HET_Code |
結合するリガンドのHETコード |
ChainID |
結合サイトのある鎖のID |
Res.No. |
結合サイトのあるアミノ酸残基の番号 |
MolName |
タンパク質の分子名 |
UniProt |
タンパク質のUniProt ID |
UniRef50 |
タンパク質のUniRef50クラスタID(解析当時のもの) |
EC |
タンパク質のEC ID |
CATH |
タンパク質のCATH ID |
SCOPe |
タンパク質のSCOPe ID |
2.8 (Drug Search)ターゲットサイトリスト
(Drug Search)ターゲットサイトリスト |
クエリサイトに類似した結合サイト(ターゲット)のリストです。 |
possum_target_protein.zip (844 KB) |
データファイルの各列のデータは以下の通りです。
項目名 | 項目の説明 |
PocketIndex |
結合サイトの内部ID |
PDB_ID |
タンパク質のPDB ID |
HET_Code |
結合するリガンドのHETコード |
ChainID |
結合サイトのある鎖のID |
Res.No. |
結合サイトのあるアミノ酸残基の番号 |
MolName |
タンパク質の分子名 |
UniProt |
タンパク質のUniProt ID |
UniRef50 |
タンパク質のUniRef50クラスタID(解析当時のもの) |
EC |
タンパク質のEC ID |
CATH |
タンパク質のCATH ID |
SCOPe |
タンパク質のSCOPe ID |
2.9 (Drug Search)ターゲットリガンドリスト
(Drug Search)ターゲットリガンドリスト |
ターゲットサイトとそれに結合するリガンドのリストです。 |
possum_target_ligand.zip (792 KB) |
データファイルの各列のデータは以下の通りです。
項目名 | 項目の説明 |
HET_Code |
リガンドのHETコード |
SimilarPockets |
リガンドに結合するターゲットサイトの内部ID |
JaccardIndex(MACCS) |
リガンドとターゲットサイトのJaccard係数(MACCSによる) |
JaccardIndex(FP2) |
リガンドとターゲットサイトのJaccard係数(FP2による) |
InChi_Key |
結合部位分子のInChIKey表示 |
CanonicalSmiles |
結合部位分子の正準化SMILES表示 |
2.10 (Drug Search)既知サイト間相同性データ
(Drug Search)既知サイト間相同性データ |
(Drug Search)クエリサイトとターゲットサイトの中で、既知の結合サイト間の相同性を示すデータです。 |
possum_binding_sites_known_similarity.zip (2.4 MB) |
データファイルの各列のデータは以下の通りです。
項目名 | 項目の説明 |
Q:PocketIndex |
クエリサイトの内部ID |
T:PocketIndex |
ターゲットサイトの内部ID |
Q:PDB_ID |
クエリサイトのPDB ID |
T:PDB_ID |
ターゲットサイトのPDB ID |
Q:HET_Code |
クエリサイトのHETコード |
T:HET_Code |
ターゲットサイトのHETコード |
Q:ChainID |
クエリサイトのある鎖のID |
T:ChainID |
ターゲットサイトのある鎖のID |
Q:Res.No. |
クエリサイトのアミノ酸残基番号 |
T:Res.No. |
ターゲットサイトのアミノ酸残基番号 |
AlignedLength |
アミノ酸アライメント長 |
RMSD |
平均二乗偏差 |
AminoIdentity |
アミノ酸の一致率 |
Q:MolName |
クエリの分子名 |
T:MolName |
ターゲットの分子名 |
Q:EC |
クエリのEC ID |
T:EC |
ターゲットのEC ID |
Q:CATH |
クエリのCATH ID |
T:CATH |
ターゲットのCATH ID |
Q:SCOPe |
クエリのSCOPe ID |
T:SCOPe |
ターゲットのSCOPe ID |
Q:UniProt |
クエリのUniProt ID |
T:UniProt |
ターゲットのUniProt ID |
Q:UniRef50 |
クエリのUniRef50クラスタID(解析当時のもの) |
T:UniRef50 |
ターゲットのUniRef50クラスタID(解析当時のもの) |
EC_Df |
クエリとターゲットのEC IDの差異の有無 |
CATH_Df |
クエリとターゲットのCATH IDの差異の有無 |
SCOPe_Df |
クエリとターゲットのSCOPe IDの差異の有無 |
ChEMBL_Assay |
ChEMBLのAssay情報の有無 |
AlignedResidues |
アミノ酸残基アライメント結果 |
2.11 (Drug Search)サイト間相同性データ
(Drug Search)サイト間相同性データ |
(Drug Search)クエリサイトとターゲットサイトの中で、既知と未知の結合サイト間の相同性を示すデータです。 |
possum_binding_sites_putative_similarity.zip (5 MB) |
データファイルの各列のデータは以下の通りです。
項目名 | 項目の説明 |
Q:PocketIndex |
クエリサイトの内部ID |
T:PocketIndex |
ターゲットサイトの内部ID |
Q:PDB_ID |
クエリサイトのPDB ID |
T:PDB_ID |
ターゲットサイトのPDB ID |
Q:HET_Code |
クエリサイトのHETコード |
T:HET_Code |
ターゲットサイトのHETコード |
Q:ChainID |
クエリサイトのある鎖のID |
T:ChainID |
ターゲットサイトのある鎖のID |
Q:Res.No. |
クエリサイトのアミノ酸残基番号 |
T:Res.No. |
ターゲットサイトのアミノ酸残基番号 |
AlignedLength |
アミノ酸アライメント長 |
RMSD |
平均二乗偏差 |
AminoIdentity |
アミノ酸の一致率 |
Q:MolName |
クエリの分子名 |
T:MolName |
ターゲットの分子名 |
Q:EC |
クエリのEC ID |
T:EC |
ターゲットのEC ID |
Q:CATH |
クエリのCATH ID |
T:CATH |
ターゲットのCATH ID |
Q:SCOPe |
クエリのSCOPe ID |
T:SCOPe |
ターゲットのSCOPe ID |
Q:UniProt |
クエリのUniProt ID |
T:UniProt |
ターゲットのUniProt ID |
Q:UniRef50 |
クエリのUniRef50クラスタID(解析当時のもの) |
T:UniRef50 |
ターゲットのUniRef50クラスタID(解析当時のもの) |
EC_Df |
クエリとターゲットのEC IDの差異の有無 |
CATH_Df |
クエリとターゲットのCATH IDの差異の有無 |
SCOPe_Df |
クエリとターゲットのSCOPe IDの差異の有無 |
ChEMBL_Assay |
ChEMBLのAssay情報の有無 |
AlignedResidues |
アミノ酸残基アライメント結果 |
3. 本データベースの利用許諾
利用許諾更新日: 2019/03/28
本データベースは、以下で定める利用許諾に基づきご利用いただくことができます。 本利用許諾は、本データベース利用における許諾内容、及び利用者が従うべき条件を定めています。
本データベースの利用許諾は、 クリエイティブ・コモンズ 表示-継承4.0 国際の定める利用許諾です。
本データベースのクレジットは、 ”PoSSuM © 産業技術総合研究所 臨海副都心センター licensed under CC表示-継承4.0 国際”ですので、 利用にあたり必ず表示してください。
クリエイティブ・コモンズ 表示-継承4.0 国際の概要は こちらです。 具体的な許諾条項は こちらをご覧ください。
本データベースにおいて、以下の条件に従う限り許諾されている事項:
- 本データベースの全部または一部に自由にアクセスし、データを取得することができます。
- 本データベースの全部または一部のデータを自由に再配布することができます。
- 本データベースの全部または一部のデータを利用した、データベースなどの翻案物を自由に作成し、配布することができます。
本利用許諾に基づいて利用する際に従うべき条件:
- 本データベースの全部または一部、あるいは翻案物の配布に際しては、本データベースの作成者のクレジットを表示しなければなりません。
- 本データベースの全部または一部のデータを利用して作成された翻案物は、CC表示-継承4.0(もしくは、それ以降のバージョン)、またはCC表示-継承互換ライセンス(リストはこちら)の下で配布されなければなりません。
- 本利用許諾で許諾されていない事項については、以下のデータベース作成者に連絡をとり、利用許諾を求める必要があります。
〒135-0064 東京都江東区青海2-4-7
国立研究開発法人 産業技術総合研究所臨海副都心センター
富井健太郎
E-mail: k-tomii[at]aist[dot]go[dot]jp
4. 更新履歴
5. 参考文献
Ito J, Ikeda K, Yamada K, Mizuguchi K, Tomii K.
PoSSuM v.2.0: data update and a new function for investigating ligand analogs and target proteins of small-molecule drugs.
Nucleic Acids Res. DB issue 2015;43:D392-8.
PMID:
25404129
Ito J, Tabei Y, Shimizu K, Tsuda K, Tomii K.
PoSSuM: a database of similar protein-ligand binding and putative pockets.
Nucleic Acids Res. DB issue 2012;40:D541-8.
PMID:
22135290
Ito J, Tabei Y, Shimizu K, Tomii K, Tsuda K.
PDB-Scale analysis of known and putative ligand binding sites with structural sketches.
Proteins 2011;80:747-63.
PMID:
22113700
Tabei Y, Uno T, Sugiyama M, Tsuda K.
Single Versus Multiple Sorting for All Pairs Similarity Search.
The 2nd Asian Conference on Machine Learning (ACML2010) 2010.
6. 連絡先
「PoSSuM」についてのお問い合わせは、下記連絡先までご連絡ください。
〒135-0064 東京都江東区青海2-4-7
国立研究開発法人 産業技術総合研究所臨海副都心センター
富井健太郎
E-mail: k-tomii[at]aist[dot]go[dot]jp