ニューラル機械翻訳(β)をリリースしました
弊社が運営する無料翻訳サイトCROSS-Transerの日英/英日翻訳に、
新たに「ニューラル機械翻訳」の機能を追加しました。
ニューラル機械翻訳って?
ニューラル機械翻訳(NMT:Neural Machine Translation)とは、機械学習の一手法であるニューラルネットワークを利用した機械翻訳です。
ニューラルネットワークは人間の脳の仕組みを模した計算モデルで、翻訳の他にも画像の解析や自動車の自動運転技術など、様々な分野に応用されている注目度の高いAI技術です。
これまでの機械翻訳の弱点を解消して、より精度の高い機械翻訳を提供するために、弊社でもこの最新技術を研究してきました。今回、その成果の第一弾をβ版として公開致しました。
これまでの機械翻訳との違い
弊社がこれまで開発してきた機械翻訳システムはルールベース機械翻訳(RBMT:Rules-Based Machine Translation)という手法で、文法ルールと辞書情報を基に訳文を生成しています。
いわば辞書を切り貼りするような訳文の作り方なので、意味は正確でも直訳調の堅くてやや読みづらい訳になることが多いという特徴があります。
対して、NMTは実際に人間が翻訳した文章を学習するので、生成される訳文も人間が書いたものに近い自然な文章になるという特徴があります。
そのため、口語表現や意訳が必要な文など、RBMTが苦手とする文の翻訳に強い傾向があります。
ただ、RBMTのように入力された文を一語ずつ翻訳するのではなく、全体のニュアンスを重視して自然な表現に翻訳するため、途中で一部の単語が抜けたり、数字の翻訳が不正確だったりという大雑把な側面もあります。
特に、学習したデータに出てこなかった単語の翻訳にはとことん弱いです。
実際の翻訳例
実際にRBMTとNMTの訳を比較してみます。
原文 | I am not rich, nor do I wish to be. |
RBMT |
私は裕福でありませんし、私はいたくありません。
|
NMT |
私は金持ちではないし、なりたいとも思わない。
|
RBMTでは be の後に続くrich が省略されているためうまく翻訳できませんが、
NMTではきれいに翻訳できています。2回目の I を省略してあえて翻訳しないのも日本語らしい書き方ですね。
次の例を見てみましょう。
原文 | Vanessa goes to school everyday. |
RBMT |
ヴァネッサは、毎日学校へ行きます。
|
NMT |
ボネータは毎日学校に行く。
|
今度はRBMTでは問題ありませんが、NMTではVanessaという名前が正しく翻訳できていません。
学習データに出てこない単語も翻訳できるようにいろいろと試行錯誤して工夫しているので、近いと言えなくもない音に翻訳されていますが、やはり不正確ですね。
このように、どちらにもいい面と悪い面があり、一概にどちらが優れていると言うのは難しいです。
CROSS-Transerでは従来のRBMTももちろんご利用いただけますので、いろいろ翻訳させて使い比べてみてください!
今後の展望
今後も学習させるデータの充実や、例示したような固有名詞の翻訳の改善など、継続的にNMTの機能をバージョンアップしていく予定です。
また、RBMTとNMTの機能を融合した新しい翻訳システムの開発も進めています。
今後ともクロスランゲージの機械翻訳への取り組みにご期待ください!