機械翻訳
機械翻訳 (きかいほんやく) とは、ある自然言語を別の自然言語へ機械的に変換する技術をいう。 例として、英語の文章を入力するとそれを翻訳した日本語の文章を出力する英日翻訳ソフトウエアなどがある。
機械翻訳の原理
現在広く使われている機械翻訳の原理は次のとおりである。 言語 X で書かれている文を言語 Y に翻訳する場合:
言語 X の文を構文解析する。 得られた構文木を、定められた規則に従って変換し、言語 Y の構文木を得る。 変換した構文木から言語 Y の文を生成する。
例として、英語から日本語への翻訳を考える。 以下のような原文が与えられたとしよう。
"I have a pen."
この文を解析して得られる構文木は次のようになる:
ここで、以下のような辞書を使って英語の単語を日本語の単語に起きかえる:
| 英語 | 日本語 |
|---|---|
| I | 私 |
| have | 持っている |
| a | - (空白) |
| pen | ペン |
構文木は次のようになる:
(S (NP (pron 私)) (VP (verb 持っている) (NP (det -) (noun ペン))))
しかしまだ語順が正しくないし、助詞もない。 ここで構文木に対して以下のような規則を適用して変換をおこなう:
"S → NP VP" というノードがあれば、それを "S → NP は VP" に変換せよ。 "VP → verb NP" というノードがあれば、それを "VP → NP を verb" に変換せよ。
すると変換された木はこのようになっている:
(S (NP (pron 私)) は (VP (NP (det -) (noun ペン)) を (verb 持っている)))
ここから、以下のような翻訳文を生成できる:
"私はペンを持っている。"
これは非常に単純な例である。 実際には英語の have は複数の語義をもつので、語義の曖昧性解消をしなければ単純に「have → 持っている」という変換をすることはできない。 また、モダリティの考慮や、照応の解決、敬語の扱い、自然な言いまわしの文の生成など実用的な翻訳ソフトウエアをつくるためには多くのことを考慮に入れる必要がある。
機械翻訳の可能性
翻訳ソフトの効果的な利用法については、旧来の考えにとらわれて、誤解されていることが非常に多いのが現状である。特に初期の翻訳ソフトの開発にかかわった人々の間では、当時とはハードウェア的にもソフトウェア的にも飛躍的な進歩があるにもかかわらず、誤解が根強い。これはひとえに「翻訳ソフトをどのように使うべきか」という議論が欠如していたことによるものである。
現在のところ、機械翻訳では小説や会話などは正しく翻訳できない。しかし、マニュアルなどにおいては構文や語彙が限定されているため、かなり高い精度が得られる。高度な英語能力、翻訳能力、パソコン技能を身につけた翻訳者が、翻訳ソフトの特性を正しく理解して使用した場合、翻訳作業の効率を大幅に向上することができる。
関連項目
自然言語処理
外部リンク
代表的な翻訳ソフトウェア
The翻訳(東芝ソリューション製) LogoVista LogoVista e-Trans ATLAS(富士通ミドルウェア製) PowerE/J(シャープ製) TransLand(ブラザー製)
代表的な翻訳サイト
POP辞書.com(ブラザー製訳語表示)
Amikai OCN翻訳サービス (英・和、韓・日) インフォシーク マルチ翻訳 (英・和、韓・日、中・日) Alis Translation Solutions WorldLingo Gist-In- EnjoyKOREA
リンク集など
AAMT(アジア太平洋機械翻訳協会) Green and White (翻訳ソフトのページ) 翻訳のためのインターネットリソース リンク集 (翻訳・辞書) (各国語相互翻訳エンジン!!)
フリーソフトを活用して 【海外サイトを日本語で読もう!】 @ウラ技