項目名 | 項目の説明 |
Surface form |
表層形:単語そのもの |
Left-context ID |
左文脈ID:その単語を左から見たときの内部状態ID (http://taku910.github.io/mecab/dic.html参照) |
Right-context ID |
右文脈ID:その単語を右から見たときの内部状態ID (http://taku910.github.io/mecab/dic.html参照) |
Cost |
コスト:その語の出現しやすさに関するコスト(小さいほど出現しやすい) |
POS |
品詞 |
POS subcategory 1 |
品詞細分類1 |
POS subcategory 2 |
品詞細分類2 |
POS subcategory 3 |
品詞細分類3 |
Conjugation type |
動詞などの活用型 |
Conjugation form |
品詞の活用形 |
Base form |
原形:単語に対応する見出し語 |
Reading('Furigana') |
読み:原形(見出し語)の読み、見出し語フラグが「V」のときは読みは表層形の読みではない場合がある |
Pronunciation |
読みから自動生成した発音 |
Source dictionary |
ソースとなる辞書、「Thesaurus2015」に固定 |
ID in Source dictionary |
ソース辞書中の番号:JSTシソーラスの「語番号」 |
J-GLOBAL ID |
J-GLOBALでのID |
Headword Flag |
見出し語フラグ: ・C: シソーラスの見出し語(あるいはその半角化) ・V: それ以外 |
Category code |
主題カテゴリーコード:JSTシソーラスにおける理工学分野のカテゴリーコード |
Common word flag 1 |
一般語フラグ1: ・1:単独でIPA辞書にある ・0:ない |
Common word flag 2 |
一般語フラグ2: 「IPA辞書解析結果」に基づく ・一般語フラグ1が「1」の場合:品詞名 ・一般語フラグ1が「0」の場合: - UNKNOWN_1:単独の未知語 - UNKNOWN_2:複数形態素に切れて、未知語を含む - MULTI_WORD:複数形態素に切れるが、すべてIPA辞書中の形態素 |
IPA dictionary analysis results |
IPA辞書解析結果: オリジナルのIPA辞書(+IPA辞書エントリーの英数記号を半角化したエントリーを持つ辞書)を使って形態素解析をした結果。複数語に切れた場合はスペースで区切って連結。ただし、人手によるチェックは行っていない。 「一般語フラグ1」「一般語フラグ2」はこの結果を利用している。 |