ブログ Blog

今後全ての機械翻訳は生成AIベースになる
~開発責任者が展望する機械翻訳の未来~

「TecYaku」の翻訳エンジンとしてChatGPTが追加されました。「TecYaku」の開発元である八楽で取締役CTOを務めるJonas Rydenhag(ヨナス・リィデンハグ)氏は、今回のアップデートは「最初の一歩」であり、「今後全ての機械翻訳は生成AIベースになっていく」と話します。AI翻訳の未来をどう描いているのか、話を聞きました。前後編でお届けするインタビューの後編となります。

今後全ての機械翻訳は生成AIベースになる

──将来的に全ての機械翻訳は、生成AIがベースになっていくというお話でした。現在のニューラルネットワークやディープラーニング(深層学習)を用いたAI翻訳(ニューラル機械翻訳:NMT)は、生成AIによる翻訳に置き換わっていくということでしょうか。

Jonas Rydenhag氏(以下、ヨナス氏) そう思います。現在、翻訳エンジンとしては、Google(NMT)、Microsoft(NMT)、DeepLなどを提供していますが、おそらくChatGPT以外の翻訳エンジンも、生成AIの知見やノウハウを既存の翻訳エンジンに取り入れていくでしょう。機械翻訳がAI翻訳に変わってきたように、将来的にはAI翻訳が生成AIベースの翻訳エンジンに変わっていくと考えています。

──今はその進化の途中なのですね。

ヨナス氏 はい。現時点では、既存のAI翻訳の方が優れていることも多いです。例えば、翻訳スピードはChatGPTよりも既存のMicrosoftなどの方が速い傾向にあります。ChatGPTは翻訳する文章によって、待ち時間が少し長いと感じることがあります。

──待ち時間が長いと感じるのは、文章全体を理解して翻訳しているからなのでしょうか。

ヨナス氏 それもあると思います。ChatGPTの場合、翻訳するセンテンスの前後、10センテンス程度を見ながら翻訳しているようです。ただ、こうした技術的な課題は、生成AIの発展に伴って解消されていきます。ChatGPTもGPT-2、GPT-3、GPT-4と発展する中で、データの処理速度は向上してきました。当初は日本語も苦手とされてきましたが、新しいGPT-4oでは多言語対応も行われています。

八楽株式会社 取締役 CTO Jonas Rydenhag(ヨナス・リィデンハグ)氏

──リリース後にユーザーからどんな反響がありましたか。

ヨナス氏 「早く使いたい」という声が大きかった分、リリース後はだいぶ落ち着きましたね(笑)。「分野」や「ドキュメント種別」などでプロンプトを駆使しなくても、簡単に利用シーンに応じて使い分けられます。今まさにどんなシーンで利用できるのか、いろいろと試しているところだと思います。リリース当初の問い合わせで多かったのは、セキュリティーに関する質問です。一般向けのChatGPTとはどう違うのか、利用している基盤の信頼性に問題はないか、などです。ChatGPT翻訳で利用している基盤は、Microsoftが提供しているAzure OpenAI Serviceという企業向けのクラウドサービスです。ユーザーのデータを、学習などの目的で二次利用しないことが規約で明確にうたわれています。セキュリティーに関しては問題がないことを理解していただいて、実際にどんな使い方ができるか、試される段階に入ってきていますね。

ChatGPTを翻訳エンジンとして組み込む作業は約4カ月で実現

──どのように開発しているのですか。

ヨナス氏 開発チームは大きく2つに分かれています。マシンラーニング(機械学習)の研究開発やシステムの構築に取り組むマシンラーニングチームと、UI/UX(ユーザーインターフェース/ユーザーエクスペリエンス)を担うアプリケーションチームです。ChatGPTとのAPI接続などをマシンラーニングチームが、ユーザーが利用するアプリケーションの画面設計などをアプリケーションチームが担うという体制です。以前から自然言語処理(NLP)やニューラルネットワークを活用したマシンラーニングの研究開発に取り組んできていたこともあり、ChatGPTを翻訳エンジンとして組み込む作業も4カ月ほどで実現できました。

──新しい技術の登場に合わせて、サービスも素早くアップデートさせてきているのですね。

ヨナス氏 そうですね。将来を見越して、さまざまな研究開発に取り組んでいます。今回のChatGPTの採用も、生成AIベースの翻訳サービスに発展させていくための最初の一歩です。

独自のアダプティブ機械翻訳エンジンを開発中

──今後の開発ロードマップや将来の展望を聞かせてください。

ヨナス氏 今、独自のアダプティブ機械翻訳エンジンを開発中です。ユーザーが登録した用語集やフレーズ集をアダプティブ機械翻訳エンジンに学習させて、コンテキストに応じてリアルタイムでの翻訳をできるようにする計画です。GoogleやMicrosoftなどの汎用機械翻訳エンジンは、ウェブ上の広範なデータを基に機械学習しているため、公開情報の少ない専門分野の翻訳において、用語などが適切に翻訳されないケースが数多くあります。独自のアダプティブ機械翻訳エンジンを開発することで、ユーザーの専門領域に適応した翻訳エンジンを活用できるようになります。

──それは興味深いですね。アダプティブ機械翻訳エンジンについては、ユーザーの期待も高そうです。

ヨナス氏 お客さまから要望が多いものについては、できるだけ早く対応していく方針です。もうひとつ、アップロードするWordファイルに含まれる文字数の制限があります。今、制限をなくすような開発を進めているところです。翻訳エンジン側のアップデートによって、改善できることもあります。例えば、ChatGPT-4oは海外に設置されたサーバーを利用するため、日本国内のサーバーを利用してほしいという声もあります。Microsoftが対応を進めているので、それを待って、国内サーバーからの提供を開始する予定です。

──生成AIが一般に普及すると、一般向けの生成AIとは異なる企業向けならではのニーズが出てくるということですね。

ヨナス氏 そうです。セキュリティーやコンプライアンスがまず課題になり、それをクリアすると、翻訳の精度や企業ニーズにあったカスタマイズができるかが課題になります。その際、外部にデータを出さずに、独自のアダプティブ機械翻訳エンジンでユーザーが登録した対訳集を活用できる機能は、大きな強みになると考えています。

──ありがとうございました。

お問合せ・資料請求 Contact us

まずはお試しください!
30日間無料トライアル実施中!!

まずは無料トライアルでお試しください。導入しようかお悩みの方でも、今なら30日間しっかり試して、じっくり検討することができます。その他のお問合せや資料請求も、お気軽にお声がけください。

トライアル実施中