「TecYaku」の翻訳エンジンとしてChatGPTが追加されました。ChatGPTは、DeepL翻訳などと何が違うのでしょうか。「TecYaku」の開発元である八楽で取締役CTOを務めるJonas Rydenhag(ヨナス・リィデンハグ)氏に、開発の狙いや機能の概要を聞きました。前後編でお届けするインタビューの前編となります。
ChatGPTでプロンプトを書かずに手軽に翻訳可能
──ChatGPTが翻訳エンジンとして新たに追加されました。どんな機能なのか、改めて教えてください。
Jonas Rydenhag氏(以下、ヨナス氏) ChatGPTで複雑なプロンプトを書かずに手軽に翻訳できる機能です。これまでに提供してきた「Google 翻訳」「DeepL翻訳」などの翻訳エンジンと違って、「語学レベル」「分野」「ドキュメント種別」「文書スタイル」をオプションで設定できます。例えば、メーカーが自社のカタログを海外販売店向けに翻訳したいという場合、分野として「電機・機械」を、ドキュメント種別として「カタログ・パンフレット」を選択すると、その状況に適した翻訳を生成できます。
──プロンプトを自分であれこれと工夫しなくてもよいのは便利ですね。従来の翻訳エンジンとは、どのあたりが違うのか教えてください。
ヨナス氏 ChatGPT翻訳のポイントは、文章のコンテキスト(文脈)に応じて翻訳が変わるということです。例えば、ドキュメント種別を選択するとき、「メール」「SNS」と「契約書」「財務諸表・IR資料」とでそれぞれ結果を比べてみると、違いが分かると思います。また、分野を選択するとき、「金融・経済」や「医療・アパレル」などを変えても違いが分かると思います。そのように生成AI側で、コンテキストを踏まえて翻訳を変えることができる点が、ChatGPTを使った翻訳の大きな特長です。
業種や部門、ビジネスシーンに応じて最適な翻訳ができる
──ChatGPT翻訳について、お薦めの使い方はありますか。
ヨナス氏 まずは、従来の翻訳エンジンを使っていて「ちょっとニュアンスが違う」「もう少しフォーマルにしたい」「よりカジュアルな文章にしたい」といったとき、ChatGPTに翻訳エンジンを変えてみるといった使い方をお薦めしています。設定を変えることで、自分のイメージに近い翻訳ができるようになると思います。また、語学レベルや文書スタイルを変えることで、翻訳に利用する単語や構文、言い回し、スタイルに設定することもできます。例えば、海外拠点に製品を展開するとき、英語が得意な人と不慣れな人向けにマニュアルの書き方を変えるといったこともできます。
──利用する部門・部署やビジネスシーンごとに、翻訳の設定を変えられるのは便利ですね。
ヨナス氏 そうですね。マニュアルやカタログを制作している部門、特許翻訳や契約書管理を行っている部門、海外向けメールやSNSマーケティングを行っている部門など、それぞれの部門ごとに適した使い方ができます。半導体を扱っている事業会社、自動車を扱っている事業会社など、グループの中の事業部ごとに使い分けることもできるでしょう。現在のChatGPTのAIモデルは英語に強みがあるといわれているので、当面は英語を中心にするのがお薦めです。今後、ChatGPT-4oなど、英語以外の言語にも強いエンジンへバージョンアップしていく予定です。その際には、日本語から現地語へ翻訳することもできるようになります。
生成AIによる翻訳をビジネスで利用したいという声が増えた
──そもそも、なぜChatGPTを翻訳エンジンとして追加しようと思ったのですか。
ヨナス氏 ChatGPTのような生成AIは、LLM(大規模言語モデル)を使って、文章全体のコンテキストを理解した翻訳が可能です。これは、従来のニューラルネットワークやディープラーニング(深層学習)を使ったAI翻訳(ニューラル機械翻訳: NMT)とは異なるアプローチです。従来のAI翻訳でも前後の短いコンテキストを理解して翻訳できましたが、文章全体を考慮するわけではないため、使う単語に一貫性がなかったり、誤訳が起こったりしていました。これに対し、生成AIは、文章全体のコンテキストを理解するため、一貫性のある、より自然な翻訳結果を期待できます。そうしたメリットに注目すると、今後、生成AIによる翻訳をビジネスで利用したいという声が増えていくことは明らかでした。ユーザーに新しい選択肢を提供するという意味でも、ChatGPT翻訳エンジンを早くリリースしたいと思っていました。実際、開発している間も「ChatGPTを搭載してほしい」という声は日に日に増えていきました。
──「TecYaku」では、ユーザーがフレーズ集や用語集を作成して、翻訳の品質を高めることができます。そうした機能はChatGPTでも利用できるのでしょうか。
ヨナス氏 はい。ChatGPTを翻訳エンジンとして採用した場合も、ユーザーの登録したフレーズや用語を翻訳に利用したり、その結果を学習して翻訳の品質を高めることができます。ChatGPTを使ってより自然で一貫性のある翻訳を行いながら、企業ごとの環境に合わせた翻訳ができるようになっています。こうしたユーザーごとに用語を学習し、翻訳環境をカスタマイズしていくことができるのは、われわれのサービスの大きな特長です。
ChatGPTが出力する翻訳は毎回異なるので、品質の担保に手間取った
──開発にあたってはどのような点に苦労しましたか。
ヨナス氏 ChatGPTが出力する翻訳が毎回同じではなく、少しずつ変化することです。従来のAI翻訳では、1つのセンテンスに対する翻訳はほぼ1つでした。ところが、ChatGPTは入力する文章が少し変わるだけで、結果が大きく変わることがあります。どうすれば同じ翻訳になるか、さまざまな条件やプロンプトの評価にとても苦労しました。ChatGPTのAPIを使った翻訳処理はすぐに開発できたのですが、こうした翻訳の評価と品質の担保に多くの時間がかかりました。
──翻訳の処理の仕方が、これまでとは違うのですね。
ヨナス氏 翻訳処理においては、原文と翻訳が対になることが重要です。文章のどの部分をどう翻訳したかを分かるようにすることで、意味を正しく理解できるようになりますし、修正したい箇所もどこかがすぐ分かるようになります。これまでのAI翻訳ではセンテンスごとに翻訳する仕組みでした。しかし、ChatGPTは文章全体を見て翻訳します。そのため、アウトプットされる翻訳が原文のどの部分に相当するのかを、調整して当てはめていく必要がありました。そのあたりの処理にも苦労しましたね。
──どう解決したのですか。
ヨナス氏 翻訳が原文のどこに対応しているかを見つける独自のAIモデルを開発し、ChatGPTの出力結果に当てはめて調整しています。翻訳処理はChatGPTで行っていますが、前後のコンテキストを見ながら文章を整えていく処理は、当社独自のものです。
セキュリティー対策がしっかりと施された環境で提供
──生成AIについては、ユーザーのデータを学習して再利用するといった懸念が問題になることがあります。大丈夫なのでしょうか。
ヨナス氏 当社のサービスは、ChatGPTのAIモデルを利用しているだけで、ユーザーのデータをChatGPT側で学習したり、二次利用させたりといったことは一切行っていません。また、翻訳に必要なデータも暗号化された安全な環境で処理されています。フレーズ集や用語集など、企業ごとにカスタマイズしたデータも企業内でのみ利用できるように設計されています。セキュリティー対策がしっかりと施された環境で提供するサービスなので、安心してご利用いただけます。
──生成AIは日々進化しています。今後はどのようにアップデートしていくのでしょうか。
ヨナス氏 ChatGPTに代表される生成AIは、伝統的な機械翻訳の世界を大きく変えるものだと考えています。将来的には、全ての機械翻訳は生成AIがベースになっていくでしょう。ChatGPTの採用は、それに向けた第一歩です。今後も最新技術をどんどん採り入れていきながら、より良いサービスを提供していきます。
後編では、機能強化や開発ロードマップについてお届けします。