MeCab用形態素解析辞書:JSTシソーラス見出し語・同義語
| データ説明 | |||||||||||||||||||||||||||||||||||||||||||||
|
|
MeCab用形態素解析辞書:JSTシソーラス見出し語・同義語 | ||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
10.18908/lsdba.nbdc02358-001.V002 |
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
JSTシソーラス(2015年版)の見出し語と同義語 (および、語中の全角英数記号を半角化したもの)を、形態素解析エンジンMeCab(<a href="http://taku910.github.io/mecab/" target="_blank">http://taku910.github.io/mecab/</a>)のユーザー辞書として使える形にしました。同義語(見出し語フラグが「V」)の読みについては、ライフサイエンス分野(主題カテゴリーに'LSxx'を含むもの、ただし、xxは2桁の数字)と電子計算機分野(主題カテゴリーに'EG01'を含むもの)のものはNBDCで独自に付与、それ以外のものは見出し語の読みを付与しています。 辞書項目はIPA辞書に基づいています。エンコードは、csvファイルはShift-JIS、dicファイルはUTF-8です。 なお、辞書中には語の間の関係に関する情報は入っていませんので、この辞書をシソーラスとして利用することはできません。 | ||||||||||||||||||||||||||||||||||||||||||||
|
|
データファイル名 :
Thesaurus2015.dic.zip (MeCab用dicフォーマット)
データのURL :
ファイルサイズ :
7.4 MB
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
http://togodb.biosciencedbc.jp/togodb/view/mecab_thesaurus | ||||||||||||||||||||||||||||||||||||||||||||
|
|
IPA辞書(mecab-ipadic-2.7.0-20070801、 上記MeCabのサイトよりダウンロード)、JST科学技術用語シソーラス(2015年版) |
||||||||||||||||||||||||||||||||||||||||||||
|
|
- |
||||||||||||||||||||||||||||||||||||||||||||
|
|
127,214件 |
||||||||||||||||||||||||||||||||||||||||||||
| データ詳細 | |||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||