◆Firefoxが、クライアントサイドの機械翻訳機能を計画
Webブラウザの Mozilla Firefox が、クライアントサイドの機械翻訳機能を搭載する計画を進めている(参照:gHacks Tech News)。
Google Chrome では、Webページの翻訳機能があるが、それは Google 自体が翻訳サービスを持っているから、そうした機能を実装できる。同じ機能を Mozilla が Firefox に組み込むには、越えないといけないハードルがある。
多くのWebサービスでは、個人が少ない頻度でしかアクセスしない場合は、無料にしていることが多い。しかし、1人や1社が大量にアクセスをおこなう場合には料金を取る。Webブラウザの機能として、Webサービスを組み込めば、そうした大量使用と見なされて、料金を支払う必要が生じるというわけだ。
そうしたことから、デフォルトで有効な機能としての提供は、料金を支払うか、何らかの提携を勝ち取る必要がある。そうでないのならば個別にユーザーが設定したり、機能追加したりする形にせざるをえない(参照:Firefox ヘルプ)。
自社で翻訳機能を持つことができれば、そうした問題を解決できる。
◆クラウド時代のプライベートとセキュリティ
しかし、Mozilla Firefox が、クライアントサイドの機械翻訳を進めているのは、そうした金銭的な理由からだけではない。実はそれ以外にも大きな理由がある。それはプライベートやセキュリティへの配慮だ。
クラウドを利用した翻訳サービスが、どういった仕組みになっているのか、意識している人は、どれだけいるだろうか。クラウドの翻訳サービスは、文章をいったんサーバー上にアップロードして、クラウド上で翻訳したあと翻訳結果をダウンロードする。
つまり、いったん翻訳サービスに全文を送り、その翻訳結果を受け取っているのだ。送った文書は翻訳サービスが自由に複製できる。社内の人間が、翻訳の質の向上のために読む可能性もある。社外に流出する危険性もある。
こうしたサービスを利用する際、公開されているWebページを翻訳するだけなら問題はない。しかし、ログインが必要なページを翻訳した場合はどうなるのか。当然、そのテキストをサーバーにアップロードしなければ翻訳できない。
ローカルの文書を翻訳した場合はどうなるのか。もちろん、サーバーにその文章を送ることになる。個人的な手紙や日記、秘密保持契約で守られた情報、契約書、そうした諸々を翻訳すれば、それらは翻訳サービスに履歴として残ることになる。
こうしたことを問題視したとき、Mozilla Firefox が取り組んでいる機能の価値が分かる。クライアントサイドの機械翻訳機能があれば、サーバーにテキストを送る必要がなくなる。サーバーにアップロードしたくない文章を、安全に翻訳することが可能になる。
Mozilla Firefox は、そうした意図を持ち、この機能の計画を進めている。
◆翻訳とは「情報を提供すること」でもある
ネット上には、様々な翻訳サイトがある。現在、最も利用されているのは、おそらく「Google 翻訳」ではないだろうか。直接利用していなくても、Google のサービスを使うことで、知らず知らずのうちに恩恵をこうむっている可能性がある。
「Google 翻訳」を利用していると、クラウドを利用した翻訳の危うさを感じる瞬間がある。何度か経験したことがあるのだが、文書を翻訳している時に、代名詞「We」のいくつかが「Google」という単語に翻訳された。
これは、機械翻訳の学習に、Google が作成したドキュメント(おそらくユーザーサポートなどの文章)を利用しており、それに似た文章を翻訳する際に「We」を「Google」に置き換えたのだ。
この「We」が他の単語になることも当然起こりうるだろう。文章を翻訳した際に、「I」や「We」や「That」が、特定の名前になる可能性はある。それが、暴露されては困るフレーズのこともあるかもしれない。
「Google 翻訳」では「情報の修正を提案」という機能があり、翻訳結果の改善を利用者から募っている。また翻訳結果にスターを付ける機能も備わっている。それはつまり、ユーザーが送ったデータを、さらなる改善のために利用しているということだ。そのデータが、どこで使われるかは分からない。クラウドを利用した翻訳は、そうしたリスクを承知の上で使わなければならない。
◆ネット経由の翻訳を振り返る
ネットを利用した翻訳の危うさについて書いた。しかし、便利であることもよく分かっている。実際に筆者も、昔からよく利用している。翻訳サイトでざっと流し読みしたあと、本文を読むと短時間で読めるので便利だ。最近の翻訳精度なら、原文をイメージしながら訳文を読むこともできる。
現在は「Google 翻訳」を利用しているが、その前は「エキサイト 翻訳」を利用していた。一時期は「Webの翻訳と言えば『エキサイト 翻訳』」という感じだったが、いつの間にか「Google 翻訳」を使う頻度が多くなり、気付くと「Google 翻訳」に完全にシフトしていた。
「エキサイト 翻訳」は、2000年に開始された(参照:エキサイト株式会社)。「Google 翻訳」は2006年開始である(参照:Google AI Blog)。それ以前はどうだったかと考えて、そういえば AltaVista(アルタビスタ)に翻訳機能があったなと思い出した。
AltaVista という名前を覚えている人は、かなり古参のインターネットユーザーだと思う。DEC の研究所から出てきたアメリカの検索エンジンだ。そこに複数言語の翻訳ができる「Babel Fish」というサービスが存在していた。登場は1997年と古い(参照:Internet Watch)。日本語に対応したのは2001年と、「エキサイト 翻訳」よりは遅い(参照:Internet Watch)。
「Babel Fish」の機械翻訳の技術は、SYSTRAN 社のものを利用している。同社は1968年に設立された。冷戦時代、機械翻訳は、ロシア語を英語に翻訳するという需要があった。ある意味、軍事技術の民間への応用と言える。
「Babel Fish」を提供していた AltaVista は、紆余曲折を経たあと、2003年にオーバーチュアに買収された。そのオーバーチュアは、2004年に Yahoo! に買収された。そして、マリッサ・メイヤーの手により、AltaVista は2013年に閉鎖された(参照:ASCII.jp)。ネット経由の翻訳ということで、 AltaVista のことを思い出したので少し書いてみた。
◆クラウド時代のプライベートとセキュリティ
昔は、ローカルにインストールして使う翻訳ソフトをよく見かけた。しかし、現在はクラウドでの翻訳が主流になっている。Mozilla Firefox がやろうとしていることは、時代に逆行するものだ。しかし、セキュリティ的な問題や、プライベートを守るのには有効な一手となる。
現在は、クラウドを利用して翻訳を代行してもらえる便利な時代だ。他人や外部の会社を利用すれば、簡単に自分の能力を拡張できる。
しかし、そうした時代だからこそ、翻訳などを自力でおこなえることは、逆に意味を持つ。翻訳せずに自分で読める人は、プライベートやセキュリティを気にする必要はない。能力を手軽に拡張できる時代だからこそ、自力でできる、あるいは手元のコンピューターでおこなえることは価値を持つ。
そうした意味で、Mozilla Firefox の取り組みは注目に値する。しかし、ひとつだけ残念なことは、英語から日本語の翻訳が難しそうな点だ。公開されているデモは、英語とドイツ語の翻訳だ。
2019-11-13 17:20:16