CaboCha/南瓜: Yet Another Japanese Dependency Structure Analyzer

$Id: index.html,v 1.61 2004/10/07 07:36:28 taku-ku Exp $;

CaboCha/南瓜とは

CaboCha は, Support Vector Machines に基づく日本語係り受け解析器です. 2001年6月現在, 統計的な日本語係り受け解析器として最も精度が高い(89.29%)システムとなっています. また, バックトラックを行なわない決定的な解析アルゴリズム (Cascaded Chunking Model) を採用しており, 比較的効率の良い解析が行なえます.

目次

実践 CaboCha

適当な文を入力してください. 解析します
学習に新聞を使用しているので, 会話文のようなドメインが異なる文はエラーが多くなるでしょう.

出力:    入力文:

入力文:

特徴

新着情報

学習データと解析精度

名前 内容 精度(後ろから2番目の文節の評価を含める)
chasen-large 京都大学コーパス 3.0 を chasenで解析した結果を学習 約 91%
chaen-med 京都大学コーパス 3.0 (奇数日,社説は奇数月) を chasen で解析した結果を学習 90.20%
chasen-small 京都大学コーパス 2.0 (950101-950108) を chasen で解析した結果を学習 88.37%

ダウンロード

Source

Binary/Source package for RedHat Linux

Binary package for MS-Windows

インストール

UNIX

Windows

使い方

CaboCha に関する発表

TODO

謝辞


$Id: index.html,v 1.61 2004/10/07 07:36:28 taku-ku Exp $;

taku@chasen.org