こんにちは。LINEヤフー株式会社で自然言語処理の開発を担当している牧野です。
今回は、Yahoo!デベロッパーネットワークから公開しているテキスト解析 Web API の「日本語形態素解析」で使えるようになった追加機能のユーザ辞書を紹介します。このユーザ辞書を使うと、自分だけのオリジナルの辞書で独自の解析が可能です。
また今回は、ユーザ辞書機能を工夫して使った簡易感情判定についても紹介します。
日本語形態素解析 Web API でできること
最初に、日本語形態素解析 Web API について簡単に紹介します。
日本語形態素解析 Web API は、日本語文を形態素に分割し、品詞の推定や活用処理、読みを付与することができます。形態素とは、日本語として意味を持つ最小単位のことです。「辞書に載っている単語」程度のイメージで捉えていただけると良いでしょう。
たとえば、「かわいい三毛猫を見た」という文の場合、「かわいい」「三毛猫」「を」「見た」など、形態素に分解できます。さらに「かわいい(形容詞)」「三毛猫(名詞)」「を(助詞)」「見た(動詞)」などの品詞の推定や、「三毛猫(みけねこ)」のような読み方の判別も可能です。
実際の Web API では下記のようなリクエスト、レスポンスとなります。
リクエスト(入力):