轉自:AI寒武紀

要實現電話通話,至少需要以下幾個關鍵能力:語音識別;語音合成;3、實時交互;這些技術OpenAI都有了,現在就看最終的產品了。

OpenAI 似乎正在努力在 chatGPT 中實現電話通話。這可能是週一宣佈的活動的一小部分,這一點從OpenAI網站一些後臺代碼就可以發現

現在,OpenAI 也已配備了 webRTC 服務器來實現這一目標,這些服務器最近也進行了配置

起初大家以爲webrtc被用於他們的純語音模式,但事實證明那是由Livekit完成的

早就2月份,OpenAI前開發者關係負責人就提及,ChatGPT的終極形態不是聊天,看起來和現在的信息對應上了

要實現電話通話,至少需要以下幾個關鍵能力:

1、語音識別 - 將語音信號轉換爲文本

2、語音合成 - 將文本轉換爲自然語音輸出

3、實時交互 - 能夠在通話過程中實時處理對方的語音輸入並作出響應

這些技術OpenAI都有了,現在就看最終的產品了

OpenAI語音技術負責人也轉發了週一發佈會的推文

相關文章