翻訳AIを導入支援する開発パートナー選びのポイント

「翻訳AI」というIT用語を聞いたことがありますでしょうか?「翻訳」は外国語を日本語に置き換えることです。

また、IT分野の「翻訳」はプログラム言語をコーディングして構文チェックをしてアセンブリ化する手前までの工程を示します。

今回紹介する「翻訳」は外国語を日本語に置き換える仕組みです。

その仕組みに人工知能(AI)機能を活用する技術を紹介していきます。

機械翻訳・自動翻訳は、この2~3年間で精度が向上しています。

従来の機械翻訳・自動翻訳は、単語変換をした文章の羅列といっていい程度でした。

しかし、この2~3年間に精度が向上し、文頭から文末まで意味が通じる文章に変遷しています。

日本国外から送信されるインターネット・メールのビジネス文書や添付されるドキュメントを機械翻訳・自動翻訳すると、自然な日本語変換ではありませんが、「読むことができる」「なんとかわかる」文章になりました。

さらに、映像・画像データ内にある文書を機械翻訳・自動翻訳するアプリケーションソフトウェアがリリースされるように進歩しています。

その機能は、画像中に含まれる文字情報(イメージ)を抽出します。

イメージデータを基にして日本語を含む多言語に翻訳する技術です。

海外出張・海外旅行に出かけたとき、街中の看板・ポスター・掲示板等を撮影して、内容を確認することができる利便性の高い機能です。

「翻訳AI」機能が進歩した理由は、人工知能(AI)機能の精度を向上させた深層学習(ディープラーニング)といわれています。

人工知能(AI)技術の進歩は機械学習(マシンラーニング)と深層学習(ディープラーニング)技術の進歩に比例しています。

「翻訳AI」は深層学習(ディープラーニング)技術が進歩したことで、精度が向上したといわれています。

 

 

1.翻訳AIとは?

「翻訳AI」とは、機械翻訳のことで、人工知能(AI)技術の一種である深層学習(ディープラーニング)機能の進歩により精度が向上したといわれています。

コンピューターは、ワープロ・表計算・プレゼンテーションドキュメント作成・イラスト作成・画像加工だけではありません。

コンピューターに搭載するために人工知能(AI)技術の研究・開発を繰り返しています。

人工知能(AI)ブームは定期的に生じています。

1999年のSONY社製の犬型ロボット「AIBO」は人工知能(AI)搭載を先駆けた製品です。

現在のブームは人工知能(AI)技術の一種である深層学習(ディープラーニング)のブームといっていいでしょう。

「翻訳AI」は人工知能(AI)技術の一種である深層学習(ディープラーニング)機能を搭載した技術で、機械翻訳を進化させています。

たとえば、従来の機械翻訳・自動翻訳は、文章・単語のもつ具体的な意味に触れていませんでした。

変換表や用例を基にして日本語に置き換えていました。

基の英文が「Today is sunny day」であれば、「今日は晴天」と置き換えます。

基の英文に対応する文例を多数用意して置き換えを行う「辞書的翻訳」方式でした。

置き換え結果を見ると「機械的」な翻訳で、置き換えの単語と単語を連結した不自然な文章でした。

しかし、「翻訳AI」は、深層学習(ディープラーニング)機能の精度向上により、より自然に近い翻訳文章に置き換えるように進歩しました。

 

 

2.大量の文例を基にして「統計的機械翻訳」がリリースされました

機械翻訳・自動翻訳の変換結果が不自然な文章になることで、大量の文例を基にして「統計的機械翻訳」が導入されました。

大量な文例を基にして、各単語を記号化しながら統計処理に基づいた機械的に処理していくことで、翻訳向けのデータベースができ上がる仕組みです。

各単語は記号として取り扱いされます。

各単語がもつ意味に関係なく置き換え処理されて文書にする仕組みです。

アプリケーションソフトウェアは文章の不自然な面があることを気にせずに、記号化した単語を翻訳文章として置き換えだけの仕様です。

2014年に「統計的機械翻訳」アプリケーションソフトウェアに大きな変化がおとずれました。

その年にアメリカ合衆国のITベンダー企業であるGoogle社が「自動翻訳機能に深層学習(ディープラーニング)を活用する」という発表がありました。

このことから、2~3年ほど前から、従来の機械翻訳・自動翻訳は、深層学習(ディープラーニング)機能を活用した「翻訳AI」へ遷移していき続けています。

 

 

3.深層学習(ディープラーニング)は「言葉の意味」まで学習をしないようです

「翻訳AI」の主要技術である深層学習(ディープラーニング)は「言葉の意味」まで学習をしないようです。

深層学習(ディープラーニング)は人工知能(AI)技術の中核となっています。

つまり、「翻訳AI」機能は人工知能(AI)が中核になる技術で、人工知能(AI)機能は深層学習(ディープラーニング)が主要な技術であることがいえます。

深層学習(ディープラーニング)は、入力データとその変換結果事例を大量に取り込むことで、人々が答えを出すことに近づける学習をします。

その結果、90%~95%の精度で結果を導くように進化しています。

「翻訳AI」は、映像・画像解析AIの技術である「顔認証」「指紋認証」「静脈認証」「OCR機能」「道路運行情報」等を認証する制度が飛躍的に進化しました。

映像・画像解析AIは人工知能(AI)機能の一種である深層学習(ディープラーニング)や機械学習(マシンラーニング)技術の導入によって認証する精度が向上したことです。

とくに深層学習(ディープラーニング)技術の進化が注目視されています。

しかし、進化した深層学習(ディープラーニング)技術を実装した機械翻訳・自動翻訳は、「文章の意味の解釈」がなされていません。

「文章の意味」を取り入れることは、従来の機械翻訳・自動翻訳から大きく前進することを意味します。

「翻訳AI」の深層学習(ディープラーニング)では、「単語の感覚」「単語の配列順序」「文章に流れ方」する学習法を取り入れ始めているようです。

たとえば、日本語の会話で「鏡」「ミラー」は同じ意味で利用されます。

深層学習(ディープラーニング)に大量な変換事例を記録させることで「鏡」「ミラー」は似なような意味を持つ言葉と判断されて「翻訳AI」で活用されます。

対象となる事例をより多く記録させることで翻訳精度が向上します。

入力データから、意味をふまえて、より自然な日本語に件間されていきます。

例題をあげると、「私の自家用車のドアー鏡は自動開閉式です。」ではなく「私の自家用車のドアーミラーは自動開閉式です。」、「嫁入り道具の三面ミラーは英国製です。」ではなく「嫁入り道具の三面鏡は英国製です。」になります。

この例題のように深層学習(ディープラーニング)による「翻訳AI」の精度が向上しています。

大手電機メーカー・ITベンダー企業・ITベンチャー企業で「翻訳AI」を研究・開発している企業・団体は、従来の機械翻訳・自動翻訳のプラットフォームを深層学習(ディープラーニング)ベースへ移行しています。

その理由は、従来の機械翻訳・自動翻訳では、単語を結合した不自然な翻訳結果が、完全とはいえないがなんとか意味が通じる翻訳結果に進化しているからです。

今後、深層学習(ディープラーニング)技術を搭載した機械翻訳・自動翻訳が、さらなる精度が向上する可能性があるとして、シフトしています。

数年後の「翻訳AI」の進歩に期待できるようです。

 

 

4.翻訳AIは「ニュアンス」を取り込めません

「翻訳AI」機能は、言葉のもつ「ニュアンス」を読み取れないのです。

現状の「翻訳AI」の翻訳能力は、中学生レベルの英語を日本語翻訳できるようになっています。

しかし、中学生レベルの英語能力は、基礎的な文法に基づく日本語翻訳程度といわれています。

ビジネス文書である「特許系のドキュメント」「輸出入に関わる法律が記載されたドキュメント」「研究論文」等を機械翻訳・自動翻訳できるレベルへの到達はほど遠いといわれています。

しかし、機械翻訳・自動翻訳をする前提で執筆者が「機械翻訳に配慮して文学的な表現をしないで基礎文法に基づいたドキュメント」を作成すれば、機械翻訳・自動翻訳の精度がアップします。

文学的な表現をしないということは、少々曖昧なニュアンスを含んだ芸術的な格好が良い文章にしないということです。

少々曖昧なニュアンスを含んだ格好いい文章は、文学的な「小説」「シナリオ」「脚本」等のカテゴリーが該当します。

この少々曖昧なニュアンスを含んだ文章は「翻訳AI」に不向きといわれています。

深層学習(ディープラーニング)は、単語に変換事例を多く記録させて学習させています。

しかし、深層学習(ディープラーニング)には「曖昧なニュアンスを含んだ格好いい文章」を学習させていないので、文章の意味を解釈できずに不自然な翻訳結果に至るのです。

「あなたの結論は愚かであった」との文章があるとします。

前後の文脈で大きく意味が大きく変異します。

前後の文脈のニュアンスを読み取って、翻訳結果に反映されることが難儀とされています。

現状では、深層学習(ディープラーニング)機能を実装した「翻訳AI」では、「少々曖昧なニュアンスを含んだ格好いい文章」の翻訳は難しい課題とされています。

また、英語で「you」という単語があります。

英和辞典で調べると日本語では「あなた」「君」になります。

しかし、「少々曖昧なニュアンスを含んだ格好いい文章」では登場する人物が女性であるにもかかわらず「彼」と誤訳するケースがあるようです。

その理由は、その人物の役割が一般に男性が担うことであると、多くの変換事例が「男性が担うこと」と記録してあれば、翻訳結果は「彼」になるのです。

登場人物が女性であることを前後文脈とそのニュアンスを取り込むことができないので、機械的に「彼」にしてしまうことが現状なのです。

コンピューターは、技術者が指令したこと・プログラミングしたことを正確に実行する電子機器です。

深層学習(ディープラーニング)機能にも、正しい変換事例を数多く記録させることが必要です。

「翻訳AI」機能の精度が向上するなかで、「誤訳」した結果を整理して、さらなる精度を向上させることが今後の課題とされています。

 

 

5.翻訳AIを導入支援する開発パートナー選びのポイント

「翻訳AI」機能は、従来の機械翻訳・自動翻訳を飛躍的に改新しました。

近年は、マイクロソフト社製のMicrosoft Office 製品と連携できるアプリケーションソフトウェアがリリースされています。

Microsoft Word、Excel、PowerPointのファイルを、画面表示を保持した状態で翻訳ができるようになりました。

また、プラグインをインストールするとWord、Excel、PowerPoint、Outlook上で翻訳ができます。

さらに、クラウドコンピューティングによる「翻訳AI」機能はセキュリティー対策が万全であることです。

海外のお取引先様と交わす重要書類の翻訳をするため、クラウドコンピューティングでの通信は全てSSLで暗号化します。

さらに、ユーザー固有の情報はハッシュ化(不可逆変換)により第三者に漏れることはない対応を施しているソリューションがあります。

「翻訳AI」機能の導入は、現行の基幹システムとの連携の必要性が多くありません。

しかし、製商品を輸出入している企業・団体は、通関書類である「インボイス」「PL」「船荷証券」「アライバルノーティス」等は機械翻訳・自動翻訳して基幹システムとのリンケージが必要です。

そのため、基幹システムを導入した開発パートナー企業を選択しましょう。

さらに「翻訳AI」を導入する開発パートナー選びのポイントは、セキュリティー対策を総合的にサポートできる大手電機メーカー・ITベンダー企業・ITベンチャー企業が選択しましょう。

さらに、導入事例・導入実績を多く持つ開発パートナー企業を選びましょう。

 

 

まとめ

「翻訳AI」は、道具です。

道具の利便性が高いか否かは、利用者が判断します。

今後、文化・言葉のニュアンスを読み取りできる「翻訳AI」が登場すると、翻訳業界は大きな変革が生じる事でしょう。

芸術性の意味合いを機械翻訳できるようになるためには、まだまだ研究・開発期間を要するようです。

 

 

システム開発のITパートナー探しをされるのであれば

システム開発のITパートナー探しをされるのであれば「システム開発コンシェルジュ」で是非ご相談いただければと思います。

以下のフォームより開発でご相談いただきたい内容などご相談ください。

    関連記事一覧