5 G新しい通話は簡単ではありません:聞こえるだけでなく理解することができます

4月12日、中国移動は首鋼園国家冬季訓練センタースピードスケート館で「5 G新通話、新未来を予見する」製品発表会を開催し、5 G新通話製品を正式に発表し、一部の端末はすでに全国で5 G VoNR超清通話業務をサポートし、可視化、多メディア、高感知、全インタラクティブの新しいメディアを構築したと発表した。

はすべての新しいタイプの をカバーします。

発表会で、中国移動市場経営部の首建国社長は、インターネットの音声ビデオ通話に比べて、5 Gの新しい通話は中国移動5 Gネットワークに基づいて、ハイビジョンビデオ通話を実現することができ、通話の質が安定し、ほとんど遅延がなく、電話の着信が中断しないと紹介した。同時に、AI技術と結びつけて、5 Gの新しい通話は通話中に中国語と英語のリアルタイム翻訳、音声の文字回転などの機能を実現することができ、またスクリーン共有、遠隔協力などの特色ある機能を提供した。首建国氏はまた、5 Gの新通話機能が各携帯電話端末で次々と適応されており、今年7月までにすべての端末が新たに発売される機種が5 Gの新通話をサポートすると紹介した。

5 Gの新通話が示す機能から、「5 Gキラー級アプリケーション」になる見込みだ。この業界で一般的に注目されている業務の背後には、5 Gネットワークが核心的な基礎であり、メディアの相互作用は重要な機能拡張であり、端末サポートは保障であり、その中でもう一つの鍵はAIスマート音声技術である。

聞こえるだけでなく、 も読めます。

5 Gの新しい通話は通話双方に音声の文字を回転させることができて、同時にスクリーンの上でリアルタイムに翻訳することができて、通話者に聞こえると同時に、通話の内容を“理解”させます。理解しやすいように見える技術の背後には、音声認識、口語理解、音声同伝など、多くのブラックテクノロジーが埋蔵されており、深いAI音声技術の蓄積ではない。

これらの背後にあるブラックテクノロジーは、主にスマート音声と人工知能の頭部企業 Iflytek Co.Ltd(002230) から来ているため、 Iflytek Co.Ltd(002230) も中国移動5 Gの新しい通話の公式パートナーとなっている。

北京2022年冬季五輪と冬パラリンピックの公式自動音声変換と翻訳の独占サプライヤーである。資料によると、冬季五輪のシーン向けの多言語音声と言語サービスプラットフォームは、 Iflytek Co.Ltd(002230) の「自動音声変換と翻訳」技術を採用し、60言語の音声合成、69言語の音声認識、168言語の機械翻訳と6言語の相互理解をサポートし、そのうち重点言語の翻訳精度は95%に達し、平均1文当たりの翻訳応答時間は0.5秒を超えない。

口語化体験よりスムーズ

通話シーンの下で大量の口語化表現があり、口語化表現は規範の書面テキストとは異なり、一般的に内容表現が文法規範に合わない、語気語が重すぎる、重複冗長などと表現され、直訳時に明らかな「機翻」の痕跡が現れ、機械翻訳の通話シーンでの応用にもっと高い要求を提出した。

Iflytek Co.Ltd(002230) の技術責任者によると、5 Gの新しい通話の口語化シーンの最適化に対して、3つの措置を取った。第二に、無監督/弱監督訓練方法を系統的に運用し、大量の口語化表現の源、目標言語単語データに基づき、自己訓練、翻訳アルゴリズムなどの強化翻訳モデルと言語モデルを採用し、口語化表現特性に対して強化訓練を実現した。第三に、音声認識後の処理段階に対して、語気語の滑らかさ、整頓などのモジュールを設計し、口語化表現をできるだけ書面化し、それによって機械の「痕跡」を減らし、ユーザーのよりよく理解することを助ける。

中国移動5 Gの新通話の背後にある人工知能技術は、 Iflytek Co.Ltd(002230) 23年来、ソース技術の自主革新を堅持してきた深い蓄積に由来している。 Iflytek Co.Ltd(002230) は人工知能音声認識、機械翻訳、意味理解などの技術分野で国際的にリードしており、多くの国際技術試合で優勝したことがある。

- Advertisment -