英語を読み書きするときの機械翻訳の上手な使い方
機械翻訳は飛躍的な進歩を遂げています。特定の分野で十分な人間の手での補助があれば、ある程度有用なツールとなってきています。ここでは、英語のビジネスメールを書く時の機械翻訳の上手な使い方をご紹介します。
機械翻訳とは
「機械翻訳(MT: Machine Translation)」とは、コンピューターを利用して自動的に自然言語を翻訳をすることです。
コンピューターの能力向上により急速に成長しており、特定の用途に限った翻訳においては人間の手で補助することで、ある程度の解決がみられるようになっています。しかしながら、研究により言語の複雑さが判明するにつれ「克服すべき課題は多く,完璧な機械翻訳を期待するのは現実的ではない」と現時点では認識されてもいます。
機械翻訳の基本的なことを説明した後、実際に英語のビジネスメールを書く時に使える機械翻訳しやすい日本語の書き方をご紹介します。
機械翻訳と翻訳支援ツール
1975年時点で現実的に研究すべき機械翻訳として、下記のものが述べられて、その視点が現在でも受け継がれています。
- 機械の支援を伴う人間翻訳
- 人間の支援を伴う機械翻訳
- 低品質の機械翻訳
現時点で英語のビジネスメールの分野でよく使われているのは、1と3でしょう。
ビジネスメールを書くときは「1. 機械の支援を伴う人間翻訳」を使って、機械の支援を受けつつ適切な英文を書いて、
ビジネスメールを読むときは「3. 低品質の機械翻訳」 を使って、おおまかに原文の内容を理解した後、精読する人が多いと思います。
「1. 機械の支援を伴う人間翻訳」のおける翻訳支援の機械は現在下記のようなサービスで実現されています。
- 翻訳メモリ・・・原文と翻訳文を一対とするデータベースを使う翻訳支援ツール
- 翻訳ソフト・・・機械翻訳を使う翻訳支援ツール
翻訳メモリとは
翻訳メモリ (Translation Memory) とは、原文と翻訳文を一対としてデータベース化し、その内容を自動的に繰り返し利用することで翻訳支援するツールです。
翻訳記憶の主な機能として下記のものがあります。
- 原文と翻訳文を一対でデータベースに登録できる機能
- 同じまたは類似の原文があった時、データベースから自動的に引用する機能
これらの機能によって、
- 同じ文章を繰り返し翻訳する
- 引用された翻訳文を手作業で複製し貼り付ける
などの単純作業を自動化することで、翻訳作業の高速化・品質向上化を期待できます。
英語のビジネスメールを書く時、比較的決まったフレーズを繰り返し使うことが多いです。よく使われるフレーズを使う状況ごとに登録してすぐ使えるようにすることは、英語のビジネスメールを書くこと特に相性が良いです。
翻訳ソフトとは
機械翻訳の機能を提供するソフトです。個人向けで無料で提供しているものもあれば、専門家や企業向けの高額なソフトもあります。一般的な使い方として、原文を機械翻訳エンジンを使って自動翻訳します。ブラウザで提供している翻訳ソフトが現在一番「機械翻訳」をイメージするものでしょう。
- Google翻訳・・・Googleが提供する翻訳サイト。無料なのに高性能、おそらく一番有名な翻訳サイト
- みらい翻訳・・・NTTグループが提供する翻訳サイト。企業向けの高価格帯の翻訳サイトだが2000文字まで無料で試用できる。日本企業が開発したので日本語の翻訳に強い翻訳サイト
- DeepL翻訳・・・今最も精度が高いのではないかと注目されている翻訳サイト
2016年以降、翻訳アルゴリズムがニューラルネットワークを使用したものに変更され、翻訳の精度が向上しています。このまま向上し続けることにより「2. 人間の支援を伴う機械翻訳」で使えるようになるかもしれないと期待されています
機械翻訳の歴史
- 1933年にピーター・トロイアンスキー氏が機械翻訳の概念を発表しました。
- 1954年にコンピューターを使って機械翻訳を始めました。
- 1966年に米国の科学者委員会は、機械翻訳を「高価で、不正確、そして見込みがない」と報告しました。機械翻訳の停滞期ですが地道な研究は続けられました。
- 1970年代には、ルールベース機械翻訳 (RBMT) が主役の座をしめていました。
- 1990年代にコンピューター性能が向上したことにより「ルールベース機械翻訳」の発展型の「統計機械翻訳」が現実的となり、機械翻訳の精度が向上しました。
- 2010年代に脳機能に見られるいくつかの特性に類似した数理的モデルであるニューラルネットワークを活用した「ニューラル機械翻訳」が誕生しました。「統計ベース機械翻訳」に比べ、多くの場合で高い翻訳品質を達成してることから、今後ますます精度向上を期待されています。
機械翻訳の仕組み
機械翻訳の基本的な仕組みは下記の通りです。技術の向上により細かい方法は変化していますが、基本的な考え方は現在も継承されています。
- 機械翻訳システムが原文を取得する
- 用例辞書から原文と似た例文とその翻訳文を検索する
- 原文と例文の差分を取る
- 単語辞書を使って、差分の単語を適切な単語に置き換える (I → We など)
- 結果を翻訳文として出力する
機械翻訳の手法は大きく分けて下記の2つに大別されます
- ルールベース機械翻訳 (RBMT)
- コーパスベース方式・・・統計的機械翻訳 (SMT) とニューラル機械翻訳 (NMT)
ルールベース機械翻訳
「用例辞書」と「単語辞書」をあらかじめ人間の手によって整備しておいて、
- 似た例文やフレーズを探すルール
- 適切な単語に置き換えるルール
に基づき機械翻訳するものです。ルールを作成した人間が想定しなかった入力文には対応できなく、翻訳ルールの記述や見直しには膨大な手間がかかるため、効率が悪いことが問題点としてありました。
コーパスベース方式
統計ベース機械翻訳
ルールベース機械翻訳の問題点を解決するために統計的に推定する方式が開発されました。パラレルコーパスと呼ばれる複数の言語で文同士の対応が付いたコーパス (自然言語処理の研究に用いるため、自然言語の文章を構造化し大規模に集積したもの) を利用し、翻訳のルールを自動的に獲得し、各ルールの重要度を統計的に推定する方式です。
この方式によって、ルールの記述・修正が自動化され効率的となり、各ルールを統計的に重み付けをすることにより機械翻訳の精度が向上しました。
ニューラル機械翻訳
大量のコーパスデータを元に、統計的に「ルールの自動化」と「ルールの重み付け」を行い、それを元にして機械翻訳するという考え方は同じですが、統計にニューラルネットワークを採用したことにより、機械翻訳の精度がさらに向上しました。多層的にルールの重み付けを行えるようになったので、センテンス単位でなく文全体単位で文脈を最適化できるようになったからだと言われています。
機械翻訳との付き合い方
ここまで機械翻訳の基本的なことについてご紹介してきました。機械翻訳がいまだ魔法のように万能ではないことに気がついたと思います。
「人間による翻訳」と「機械翻訳」には、まだまだギャップが残っています。機械翻訳の学習能力が進歩したとしても、文章のニュアンスを的確に伝え「文化特有の表現」や「価値観」「習慣」「文脈」まで表現するのはとても難しいでしょう。
機械翻訳との付き合いにおいては、しばらくは、
- 機械の支援を伴う人間翻訳
- 人間の支援を伴う機械翻訳
- 低品質の機械翻訳
のうち、英語のビジネスメールを
書く時は「1. 機械の支援を伴う人間翻訳 」
読む時は「3. 低品質の機械翻訳」
として、サポートツール的に使うのが良いでしょう。
機械翻訳をうまくサポートツールとして使いこなす技能は、今後も陳腐化することはありません。機械翻訳の能力が向上するほど、その技能に支えられて英語を読み書きする能力も一段と向上するのですから。
機械翻訳の上手な使い方
英語のビジネスメールで自分の意思を伝えるための英文を、機械翻訳をうまくサポートツールとして使いこなして作成するテクニックをご紹介します。
アプローチとしてはシンプルです。「機械翻訳が英訳しやすい日本語をどのように作成するか」がその内容になります。機械翻訳をハックするのです。
言語には距離 (文法や単語の成り立ちの違い) があります。その距離が遠ければ遠いほどその言語を習得するのが難しくなります。機械翻訳にも同様で、距離が遠い言語間の翻訳ほど精度は落ちていきます。
そこで、日本語をできるだけシンプルに、英語に歩み寄る形で記述することで、言語間の距離を縮めます。そうすることにより機械翻訳の精度が向上します。以下のテクニックを使って「日本語で、はっきりと自分の意志を伝えることのできる文にする」ことで、機械翻訳を上手に使えるでしょう。
- 主語を必ず入れる・・・送りました → 私は送りました
- 述語を明確にする・・・やっておきました → 送信しました
- 目的語を明確にする・・・送りました → Eメールを送りました
- 句点をつけない・・・句点(、)は全部削除した方が精度が向上します
- 単文 (1文で1つの意味を持つ) にする・・・主語+述語+目的語だけのシンプルな文
- 余分な修飾語はつけない・・・ニュアンスを付けたいときは英文に修飾語を後付する
- シンプルな言い回しにする・・・「難しい」「○○しかねる」→ 「できない」
- できるだけ漢字を使う・・・やさしい人 → 優しい人