形態素解析は、日本語テキスト処理を支える基本的かつ重要な技術である。 しかし、実応用として製品利用しようとした際,単語単位の不一致や表記揺れなど様々な問題がある。 そこで、我々はこれらの問題を改善するために形態素解析器「Sudachi」および「SudachiPy」を商用利用可能なライセンスのOSSとして公開し、継続的な改善・保守を続けている。 本発表では、中でもSudachiPyを題材に取り上げ,上記の問題を扱うためのSudachiPyの特徴的な機能について紹介する。 また、SudachiPyの現在の開発状況と今後どのような方向を目指して開発を行っているのかについても紹介する。

Speaker Deck / 2ヶ月

この記事へのコメントはありません

appstore
googleplay
会員登録

会員登録して、もっと便利に利用しよう

  • 1.

    記事をストックできる
    気になる記事をピックして、いつでも読み返すことができます。
  • 2.

    新着ニュースをカスタマイズできます
    好きなニュースフィードをフォローすると、新着ニュースが受け取れます。