Google 翻訳の今と未来 − from Google I/O 2013

今月15日から17日の3日間、米サンフランシスコで Google の開発者向け会議「Google I/O 2013」が開催されました。

そこでは話題の Google Glass や Android についてのセッションに混じって、Google Translate(Google 翻訳)についてのセッションも行われたようです。

このセッションでは、Google 翻訳の開発に7年間携わってきたチームリーダーの Josh Estelle 氏が Google 翻訳の今と未来を様々な視点から語っています。

CNET でその時の模様が詳しくレポートされていますので、一部を紹介してみましょう。

Google Translate provides a billion translations a day for 200 million users,

(Google 翻訳は1日あたり、2億人のユーザーに10億回の翻訳を提供している。)

1日10億回とはとんでもない数字です。このトラフィックの大半は、英語を含む翻訳だと推察されますが、徐々に他の言語への広がりも出てきているようです。

92 percent of the usage is from people outside the United States. The Internet is famously English-centric, but it’s expanding gradually to other languages, helped in part by technological change such as right-to-left text support in browsers, and Web addresses that can be written in non-Roman alphabets.

(利用数の92%はアメリカ合衆国以外の人々である。インターネットは知られているように英語中心の世界ではあるが、徐々に他の言語にも広がりつつある。このことはブラウザ上で右から左へのテキスト入力をサポートしたり、ウェブアドレスをローマ字以外のアルファベットで表記したり、といった技術革新によっても支えられている。)

Google 翻訳は、右から左へ書くアラビア語や、漢字を擁する中国語や日本語にももちろん対応しています。

何気なく使ってはいるものの、このあたりはヨーロッパ系言語とは全く異なる技術を必要としているのかもしれません。

The service now works in 71 languages; the last five added are Bosnian, Cebuano, Hmong, Javanese, and Marathi,

(このサービスは、今や71の言語で利用できる。最近付け足された5つの言語は、ボスニア語、セブ語、ミャオ語、ジャワ語、マラーティー語である。)

ミャオ語? 全然聞いたことのない言葉の名前が出てきました。

Google 翻訳は、Web上のテキストをデータベースとしてシステムを構築するため、マイナーな言語であれば、それだけシステムを構築するためのハードルは上がります。

そんな中、これだけ広範な言語をカバーしているというのは、驚くべきことではないでしょうか。

またこの71の言語というのは、単に英語と紐付けされているだけでなく、あらゆる組み合わせで利用することができます。

私が最もよく利用しているのは、英語圏の人にとっては全く縁のなさそうな「日本語←→フィンランド語」という組み合わせなので、このテクノロジーにはずいぶん助けられているということになります。

またプレゼンターの Estelle 氏は Google Translate が目指す未来として、次の4つを挙げています。

 

More languages(より多くの言語)

これは楽しみ。エストニア語やアイスランド語はもうサポートされていますが、サーミ語はまだのようです。いつの日か?

 

Better quality(よりよい品質)

これは最も大切な要素でしょう。しかし完璧な機械翻訳が生まれたら何だか怖い気がするのは、私だけでしょうか?

 

Ubiquity(どこでも使えるように)

Google 翻訳には、すでに Android や iPhone のアプリも存在しています。機会があれば、そのうちレビューをしてみたいと思います。

 

Real-time communication(同時性のコミュニケーション)

例えば、Skype などで、AさんとBさんがそれぞれ違う言語で話をし、機械同時通訳の助けを借りながらコミュニケーションをするというような未来は来るのでしょうか?

そのような技術があれば、語学への応用もできそうです。

というより、このテクノロジーは語学の必要ない未来を目指しているのかもしれません。

そう考えるとやや複雑な気持ちになります。

 

なおこのセッションに興味のある方は、こちらから動画を見ることができます。(英語字幕あり)

機械翻訳の歴史や、Google 翻訳の方程式(?)にも触れた、大変興味深い内容になっていました。

私個人は最新のテクノロジーを追うタイプの人間ではないのですが、この分野だけはこの先どこまで進化することができるのか、なるべく先の方まで見届けたいと思っています。