OpenAIが音声エージェントのスーパーパワーを開発者に提供 – 近日中にさらに多くのアプリが登場予定 from zdnet.com

OpenAIが音声エージェントのスーパーパワーを開発者に提供 – 近日中にさらに多くのアプリが登場予定 from zdnet.com security summary

OpenAIが音声エージェントのスーパーパワーを開発者に提供 – 近日中にさらに多くのアプリが登場予定 from zdnet.com


OpenAIは、同社で最も先進的な音声合成モデル「GPT Realtime」をリリースしました。
同社は、AIエージェントがより多くのツールにアクセスし、ユーザーを支援するためのコンテキストを豊富に持つと主張しています。
さらに、音声アシスタント機能にインテリジェンス、指示追従機能など、様々な改良点が追加されました。
特に注目すべきは、GPTは人間と直接会話できる初のAIエージェントであるということです。
音声合成技術を用いた言語学習アルゴリズムは、開発者向けに一般公開されています。
今年は、音声合成技術を用いた製品版(オーディエンス)で、人間の自然なモデルがユーザー入力のタスクを支援するようになります。
音声合成技術には、SIPベースのコミュニケーション機能を通じて提供される会話スキルをサポートする、意味的にコンパクト化可能な言語などの言語化アプリケーションで使用される音声合成機能も含まれます。
この機能は、OpenAIで最近発表されましたが、ネイティブアクセス可能な語彙よりも限られた数の文しか扱えないため、広く利用可能になる可能性があります。
また、音声合成リアルタイムバージョン2.0のリリースは、後日予定されています。

コメント

タイトルとURLをコピーしました