■人の校正作業をデータ化して学習!
2012年4月4日、
株式会社富士通研究所は人が校正した文章の履歴を使い、文書を
自動的に校正するシステムの開発に成功したことを発表した。
同システムは、日本語作業のグローバル化により外国人によって書かれた日本語を校正する目的で開発されたものである。
同システムでは中国人の書いた日本語文章の誤りを80%修正できることが可能となっている。また、校正履歴が積みあがればその精度も上がっていくシステムとなっている。
外国人の日本語文章に限らず、低コストで校正作業が可能となるシステムとして活用の幅は非常に広い。
■能力が高まる校正アルゴリズム
今までの校正システムでは一つの文書の中に複数の誤りがある場合にはその構成が困難であった。
今回のシステムでは、人の行った校正履歴をデータとして使い、構成を行うことで精度の高い校正が可能となっている。
同システムでは以下のようなことが可能となる。
対象文と似た文を修正前の文に持つ校正履歴データを検索
対象文と修正前の文の共通部分と修正後の相違部分を特定
対応する語句が持っている品詞など文の構造としての共通性から文の距離を求め校正の可否を判断
校正可能であれば、対象文の表現を修正
このような機能をベースとして、「梅雨は雨を降ります」という一つの文書の中に複数の誤りを持つ場合でも、校正が可能となるシステムとなっている。
本来、中国語ネイティブの人の書いた文書を校正するために開発されたシステムであるが、日本語文書の校正作業に広く活用できる可能性をもっている。従来の同様なシステムに比べ精度がかなり高い。
同社では2013年にクラウドサービスとしての実用化を目指すとしている。
【
naka773】

業界初!人から学習し自動的に能力が高まる文章校正技術の開発に成功 : 富士通
http://pr.fujitsu.com/jp/news/2012/04/4.html