自然言語処理ライブラリ「Camphr」(カンファー)をオープンソースとして公開

  • 自然言語処理

実績概要


プロジェクト期間
2020/2/12 (OSS公開)

研究者やエンジニアによる自然言語処理システムの研究・サービス開発の効率化・高度化と、それによる自然言語処理技術の社会実装の加速を目的として、「Camphr」を開発し、公開いたしました。Camphrは、様々な手法を統一的に扱い、パイプライン化できるフレームワーク「spaCy」のプラグインとして実装されています。Camphrを利用すると、開発者はspaCyの枠組みの上で、最先端の深層学習手法から従来のパターン・辞書等を用いたアルゴリズムまでを簡単に組み合わせて使用できます。

技術について


Camphrは、最先端の深層学習手法から従来のパターン・辞書等を用いたアルゴリズムまでを自由に組み合わせられる、自然言語処理のためのオープンソース・ソフトウエアです。自然言語処理のフレームワークであるspaCyのプラグインとして実装されており、一連の処理をパイプラインとして組み立てて扱うことを容易にします。Camphrでは、BERT・XLNet等の深層学習モデルを用いた言語解析・学習機能、多言語対応、キーワード抽出、埋め込みベクトル演算機能、KNPを利用した構文解析機能等が利用できます。

担当メンバー

  • 渡邉 陽太郎YOTARO
    Watanabe

    奈良先端科学技術大学院大学博士後期課程修了後、東北大学大学院情報科学研究科助教。その間、主に自然言語処理、特に言語の意味解析技術・推論技術の研究に従事。大手電機メーカーにてAI関連技術のプロジェクトリーダーを務めた後、PKSHA Technology参画。博士(工学)。日本ディープラーニング協会元理事。