Pangeanicのランゲージ・テクノロジー
AI翻訳やテキストの自動処理は、もはや未来の話ではなく、ランゲージ・テクノロジーの進歩によって現実のものとなりました。Pangeanicでは、計算言語学の研究と発展に力を注ぎ、自動翻訳や効率的な翻訳のための最先端の技術と、それに関連する言語サービスをお客様に提供しています。当社が扱うランゲージ・テクノロジーと、それがどのようにあなたの会社に役立つのかご説明します。
ランゲージ・テクノロジーは、ヒューマン・ランゲージ・テクノロジー(HLT)とも呼ばれ、話し言葉や書き言葉を使ってコンピュータプログラムが応答を創出、変更、または生成できるようにする一連の学問分野です。
つまり、コンピュータサイエンスと言語学の知識を組み合わせた学問であり、自然言語処理(NLP)に関連するような新しい研究分野を生み出しています。
ランゲージ・テクノロジーの具体的な用途としては、機械翻訳、匿名化、感情分析、要約化などのサービスがあります。
これらは、インターネットによってあらゆるものが相互に接続されるようになったグローバル市場で役に立つ機能です。
一例として、CSA Research社の調査結果では、67%の消費者が母国語で書かれたウェブサイトから商品を購入したいと考えています。そのため、企業はデジタル・プレゼンスのために機械翻訳サービスを求めるようになっています。
また、ユーザーデータの収集や処理を必要とする企業は、匿名化処理によって効率的に法律を遵守できるランゲージ・テクノロジーに注目しています。
こちらの記事にも興味がありますか?機械翻訳が苦手な言語
当社の機械翻訳サービスでは、何億もの単語をわずか数秒で、ほぼ人間並みの品質で翻訳することができます。
そのために当社は、
強力なニューラルネットワークを採用した最新技術を、当社の安全なプライベートクラウドまたはお客様所有のインフラで提供します。また、当社が備えるAPI技術と独自の機械翻訳エンジンをカスタマイズして、機械翻訳エンジン用の学習プログラムを通じて、大胆で影響力のあるディープラーニングのあらゆる段階に適用できます。
5,000名以上の認定翻訳者がもつ管理能力、経験、言語的専門知識を活用します。
このようなサービスを必要とするお客様には、法律事務所(国際訴訟の場合)、金融機関、eコマース企業、マーケティング、政府・行政、観光・レジャー分野、コンテンツやニュースのリリースに関連する企業などがあります。
深層適応型機械翻訳アルゴリズムは、膨大なテキストのデータベースを使用して、関連するデータを自動的に選択し、スタイルや表現などの言語的課題も含めて、人間の翻訳者の作業を模倣します。
従来の機械翻訳とは異なり、深層適応型機械翻訳は、企業が入手できる翻訳コンテンツを増やし、より速く経済的にアクセスできるようにします。
そのために、機械学習と連携した技術を用いて、必要な語彙や翻訳プロセスを模倣したクローン翻訳エンジンを作成しています。ですから、専門用語を使う企業(例:法律や金融分野など)にも適しています。
匿名化サービスは、企業が収集したデータの機密性を確保し、欧州のデータ保護規則(GDPR)レベルの要件を満たすために不可欠です。
匿名化とは、データから個人を特定する情報を取り除き、認識されないようにすることです。このプロセスは、匿名化、疑似匿名化、および非識別化と呼ばれる一連の手順で、多かれ少なかれ積極的に(二次情報の除去を含めて)行われます。Pangeanicでは、この3つの手順を実行できる、受賞歴のある匿名化プラットフォームを用意しています。
さらに、ランゲージ・テクノロジーの普及と利便性のために、当社はMAPAという欧州のプロジェクトを率先して進めており、行政のためのオープンソースシステムの構築を目指しています。
ヒューマン・ランゲージ・テクノロジーと呼ばれる分野の中で要約化は、膨大な量の単語や文章の中から、最も関連性の高い文や段落を特定することです。この次のステップは、短くてすぐに読めるドキュメントを新たに作ることです。
このようにして、必要なデータを見つけ出し、有用でないデータを廃棄することで、手作業のプロセスを排除し、あらゆる観点で費用対効果を高めることができます。
Pangeanicでは、数学的計算と最新技術を用いた抜粋と抽出による要約化サービスを提供し、効率的で正確な要約化処理を実現しています。
感情分析とは、企業に対するユーザーの意見を理解し、デジタルプラットフォーム上で形成されたブランドイメージを把握できるようにする機能です。ランゲージ・テクノロジーを利用すれば、多言語による何千ものレビューを、簡単に速く正確に分析することができます。
このサービスの利用が拡大しているのは、製品の成否におけるユーザーの声の重要性が増しているためです。ほぼ5人のうち4人の消費者(79%)が、商品を購入する際に他のユーザーのレビューを参考にしています。
Pangeanicの感情分析ツールはカスタマイズ可能で、特定の感情を検出することができます。これにより企業は、ユーザーエクスペリエンスプロセスの改善に必要な情報を得られるなどのメリットがあります。また、感情分析用の用語集の使用と、新たに監修した学習観点とを組み合わせたハイブリッドな手法を用いています。これにより、精度80~90%の結果が得られます。
おすすめの記事:機械翻訳エンジンの鍛え方
テキスト自動分類のサービスでは、一般的な、あるいは個別の分類法に従って、あらゆる言語のテキストやドキュメントを、簡単な方法で分類することができます。
Pangeanicのテキスト自動分類プラットフォームには柔軟性があり、適切なアルゴリズムやテキストの特徴を、ユーザーがプロジェクトごとに選択できます。
本ツールでは、正確な結果が得られる深層ニューラルネットワークを使用するだけでなく、最高の精度でテキストを分類するための自己学習と訓練も行います。
当社の言語検出サービスは、数秒のうちに自動的に言語を識別することができます。
機械翻訳や翻訳エンジンの学習に必要な事前処理から、大量の情報の整理まで、さまざまな目的で利用できる多言語情報処理サービスです。
つまり、Pangeanicでは、ランゲージ・テクノロジーの発展にかかわるすべての分野をリードできるよう努めています。最先端のテクノロジー、継続的な学習とイノベーションへの取り組み、そして言語学の専門家であり、新しいテクノロジーの可能性に対応できる人材のチームとを独自に組み合わせて、お客様にすべてのサービスを高い品質でお届けしています。