こんにちは。LINEヤフー株式会社でテキストマイニングや自然言語処理などをやっている山下( @yto )です。
Yahoo!デベロッパーネットワークのテキスト解析 Web API が CORS(Cross-Origin Resource Sharing)対応したため、サーバがなくてもブラウザから直接 Web API にアクセスできるようになりました(参考)。
そのテキスト解析 Web API の機能の一つである「校正支援」は日本語文章の品質チェック(校正)を支援するもので、文字の入力ミス、言葉の誤用、わかりにくい表記、不適切な表現などが使われていないかをチェックして、指摘します(内部の辞書データをベースとしているため完全なものではないことをご承知おきください)。
この校正支援機能のサンプルプログラムとして「HTML ファイル1つだけで完結する校正支援ツール」を作ったので紹介します。入力されたテキストに対する校正指摘をわかりやすく表示し、指摘箇所へのアクションを簡単に行える UI を持ち、特別なアプリやサーバを用意する必要がなく、Web ブラウザさえあれば今日からすぐに使える校正支援ツールとなっております。
本稿では、まずはツールのこの校正支援ツール使い方を説明し、その後にコードの説明をしていきます。
校正支援ツールの使い方
ブラウザで校正支援ツールの HTML ファイル jlp-kousei.html
(後述)を開きます。図1に実行例を示します。
図1: 実行例
ページには3つのエリアが縦 に並んでいます。上から、校正をかけたい文章を入力する「入力テキスト」エリア、校正支援 API の結果を表示・編集する「出力操作パネル」、最終稿を表示する「出力テキスト」エリアです。
こんな文章はあまり一般的ではないかもしれませんが、例文として
矢張りセキュリティーで食べられるのかが問題なる。
しかし一週年記念で蟀谷が痛い。
を入力しました。
出力操作パネルに指摘箇所が表示されます。指摘箇所と対応例をいくつか解説します。
- 「セキュリティー」→「セキュリティ」
- 「用字」に関する指摘で、末尾の「ー」について
- 「語末が-tyだが昨今のネット上の慣習に準ず」とのこと
- 指摘理由はマウスカーソルを置くとポップアップされます (図2)
- ポップアップは title 属性を使っているだけなので、表示されるまで時間がかかることがあります
- 変更候補(グリーン背景)をクリックして承認
- 「食べれる」→「食べられる」
- 「ら抜き」に関する指摘
- 変更候補をクリックして承認
- 「問題なる」
- 「助詞不足の可能性あり」という指摘
- クリックして修正(助詞「と」を挿入)して承認
- 「蟀谷」
- 「表外漢字あり」という指摘
- クリックして修正して承認 (図3)
図2: 指摘理由のポップアップ
図3: 変更候補の編集
一番下の出力テキストエリアに修正後の文章が表示されるので、必要に応じてさらにそこで編集して、最後にコピーボタンでコピーして終了です。
もう少し詳しい使い方も載せておきます。API を使い倒したい人やプログラムをカスタムしたい人など向けです。
- 「入力テキスト」エリア
- 校正したいテキストを貼り付ける
- 「校正開始」ボタンを押す
- 「出力操作パネル」に結果が出力される
- 「出力操作パネル」
- 校正支援 API による指摘箇所の入ったテキストが表示される
- 指摘箇所
- ピンク背景がオリジナル文字列
- 校正支援 API に指摘された文字列である
- クリックすると指摘が否認される(オリジナル文字列が採用される)
- グリーン背景が変更候補文字列
- 変更候補がない場合はオリジナル文字列が表示される
- クリックすると指摘が承認される(変更候補が採用される)
- 変更候補文字列は編集可能
- 承認と否認の切り替えはチェックボックスでも可能
- 指摘箇所にマウスカーソルをあてると、指摘理由がポップアップされる
- ピンク背景がオリジナル文字列
- 出力操作パネルの下にあるボタン
- 「一括承認」ボタンはすべてを承認
- 「承認リセット」ボタンはすべてを否認
- 「出力テキスト」エリア
- 「出力操作パネル」の中身に連動した、校正後のテキスト(最終結果)が表示される
- 「コピー」ボタンでクリップボードにコピーできる