ブログ | Pangeanic

パンゲア人工知能プロジェクト

作成者: Carla Estefanía|09/06/24

 

2024年更新

パンゲアニック人工知能プロジェクトの開始以来、同社は人工知能(AI)、特に自然言語処理(NLP)と機械翻訳の分野で重要な成果を上げました。彼らのAI成果には、非構造化ソースからのデータを解釈し構造化するECOプラットフォームの開発が含まれ、さまざまなシステムでシームレスなデータ処理を可能にします。このプラットフォームは、データ、ドキュメント、電子メール分類技術を促進し、言語の障壁とデータの課題を打破します。パンゲアニックのAIモデルは、組織が情報を効率的に処理できるようにし、正確で関連性の高いデータに基づいて情報に基づいた意思決定を可能にします。さらに、パンゲアニックは、ディープ・アダプティブ・マシン・トランスレーション、テキストとデータの分類、データマスキングと匿名化、PII/個人データ検出、統合要約などのAIサービスの範囲を提供しています。その有名なデータアノテーションツールは、PECATと呼ばれています。

PパンゲアニックのAIチャットボットはECOChatと呼ばれ、カスタムLLMを使用して既存のウェブサイトとシームレスに統合し、非構造化ソースからのデータを解釈し構造化します。これらのチャットボットは、ウェブサイトデータでわずか1時間で構築でき、第三者へのデータ転送を必要とせずに迅速かつ効率的なセットアッププロセスを保証します。プライベートな文書やレポートを注入することで、パンゲアニックのAIチャットボットは、プライバシーを尊重する完全なAIアシスタントを作成し、内部および外部からの情報検索、クライアントの問い合わせ、スタッフの問い合わせの管理に相当な時間を節約します。さらに、パンゲアニックのAIチャットボットは、公共データを使用してベースラインチャットボットを構築し、ユーザーがチャットボットがどの文書とPDFとやり取りするかを制御することができます。この統合により、組織はAI機械翻訳を使用して、ユーザー、従業員、クライアントと複数の言語でコミュニケーションをとり、手動での相互作用で数千時間を節約できます。さらに、パンゲアニックは、多言語の知識管理と翻訳のためのカスタマイズされたソリューションを提供し、完全なプライバシーで大規模言語モデル(LLM)の生成特性を活用します。

 

多くの人にとって、Google Translateは絶対的な問題解決者です:コピー・ペーストすると翻訳が魔法のように表示されます。

しかし、無邪気さと誤用は、無料のオンライン翻訳アプリケーションを不完全なものにします。

無料のオンラインツールは、技術が可能にすることのデモバージョンに過ぎず、単言語テキストを収集する優れた方法です。さらに、彼らの主要な翻訳能力は、単に選択された言語に限定され、その後、英語を介してピボットします(日本語からドイツ語への翻訳は、日本語から英語への最初の翻訳を介して「橋渡し」を必要とします)。それは、これらの言語の組み合わせの背後にある黒魔術です。

一部の言語は、ある程度しか理解できません。ウェブサイトを翻訳したり、膨大な量のデータを必要としているビジネスオーナーにとって、「無料」の結果は、外国語クラスでの低い成績以上のものかもしれません。プレゼンテーションを行う役員や代表者にとって、自分の権威ある記録を無効に翻訳したり、さらに悪いことに、人間による編集なしに機械翻訳の出力に完全に依存している印象を与えることほど残念なことはありません。

結果は、破綻したビジネス取引または不適切な解決策になる可能性があります。パンゲアニックは、この危険を軽減するために2017年にニューラル機械翻訳プロジェクトを開始しました。それはAIを応用して自然言語処理技術の限界を解決する完全な人工知能プロジェクトに発展しました。

パンゲアニックはバレンシア(スペイン)に本社を置き、マドリードとロンドンにオフィスを構えています。2019年に米国に設立され、ボストンとサンフランシスコに本社があり、シカゴ、マイアミ、ヒューストンに販売代理店があります。パンゲアニックの創設者、マヌエル・ヘランツは、世界がソーシャルコミュニティになるにつれて、プライバシーの問題のために、言語転送は主要なソリューション(Google Translate、Amazon、Bing Translator)によって解決できないことを理解しました。

多くのテキストユーザー生成コンテンツは、コンテンツジェネレーターにフィードバックし、ブランドの評判、契約、企業、社会グループ、ネットワーク、国家間の国際訴訟およびドキュメントに影響を与えます。プライベートで高速な言語転送の必要性は、残っている主な障壁です。テクノロジー部門であるPangeaMTを通じて、最先端のイノベーションを開発し、実装し、活用することがパンゲアニックの使命であり、それは私たちがパンゲアニック人工知能プロジェクトと呼んでいるものです。同社は、膨大な量のデータ、広範な法律記録、ビッグデータ、大量の情報を解読しようとしています。その技術部門であるPangeaMTは、iADAATPAやNEC TMのようなプロジェクトやデジタルインフラストラクチャを頻繁に欧州委員会に提供し、加盟国で実施しています。

パンゲアニック人工知能プロジェクトとは?

パンゲアニックエンジンの1つが処理(言語転送)を完了すると、出力が改善され、ISO標準に従って、機械の神経出力(翻訳)を出版の準備ができている人間の品質の言語に適応させるための適切な能力を持つ資格のある言語学者によって人間化されます。私たちはこのプロセスをポストエディットと呼んでいますが、これは2つの異なる方法で行われる可能性があります:ライトポストエディットまたはディープポストエディット。ライト・ポストエディットは、人間が人間の読者にとってテキストを理解不能にする重要なエラーのみを修正することを指します。対照的に、ディープ・ポストエディットは、すべての機械エラーを修正し、「文字通りの」または「機械翻訳」の痕跡をすべて排除する批判的な読み取りを指します。

では、AIはどこで登場するのでしょうか? パンゲアニックのマシンは人間の入力から学習し、人間の好みに即座に適応します。2つの学術論文は私たちのR&Dの結果でした:

要するに、各システムは、深層学習が適用されるMTシステムのための並列コーパスに基づいて、大規模な汎用翻訳エンジンを作成します。人間が機械のエラーや変更を修正すると、エンジンは人間の好みを学習し、それらの好みがすべて保存される「ミラー」を作成します。大規模で汎用なエンジンは、多くのトピックに特化することができ、それぞれはすべてのユーザーの好みを含んでいます。パンゲアニックが言語処理と人工知能を類似のアプローチで組み合わせる他の分野は、匿名化、キーデータ抽出、テキストの自動分類、および要約です。すべては特定のプロジェクトと設定で組み合わせることができ、すべて私たちのチームから入手できます!