ChatGPT重磅功能全量開放:支持中文普通話

文章來源: - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數

不用等到秋天,今天淩晨,OpenAI 宣布 ChatGPT 新版高級語音模式將在本周內向所有 Plus 和 Team 用戶全量推送。

OpenAI CEO Sam Altman 在 X 平台發文稱:

高級語音模式今天正式上線!(將在本周內全量推送)希望你覺得等待是值得的 ????

不過,新版高級語音模式每天的使用時間也是有限製,並且這個限製也會有所變化,當用戶的使用時間剩餘 15 分鍾時,係統就會發出提醒。

這意味著,想要將其作為 24 小時無話不談的 AI 密友可能不太現實。

判斷你是否已經獲得推送資格有兩種簡單的方法。

第一種,如果獲得資格推送,當你首次訪問語音模式時,App 中將顯示以下通知:

第二種方法則是通過檢查語音風格的數量來判斷。

此前,ChatGPT 支持五種預設語音風格,但後續由於「Sky」語音風格與「寡姐」的法律糾紛而遭到下架。

今天,OpenAI 一口氣推出了五種聽起來更自然的全新語音風格——Vale、Spruce、Arbor、Maple、Sol。

OpenAI 官網是這樣描述這九種聲音的:

Arbor - 隨和且多才多藝

Breeze - 生動且認真

Cove - 沉著且直率

Ember - 自信且樂觀

Juniper - 開放且樂觀

Maple - 開朗且坦率

Sol - 精明且輕鬆

Spruce - 冷靜且確信

Vale - 聰明且好奇

在聽完新增的語音風格後,網友們也都是蘿卜青菜各有所愛。有的懷念起 「Sky」,有的則已經沉浸在新的語音風格中。目前呼聲比較高則是 Sol,你更喜歡哪種音色,也歡迎在評論區分享。

那 ChatGPT 的高級語音模式的效果如何呢?

官方提供了一個示例,當你因為遲到而想真誠地向隻會說普通話的奶奶道歉時,你可以借助會說 50 多種語言的 ChatGPT 來實現這一訴求。

你沒有聽錯,ChatGPT 就這樣字正腔圓地說出了下麵這番普通話:

奶奶,對不起,我遲到了,我不是故意讓您等這麽久的,我可以怎麽補償您呢?

此外,ChatGPT 的高級語音模式現在還支持設定自定義指令。

OpenAI 員工指出,聲音模態(聲音的傳遞方式)包含許多元素,這些元素在文本對話中可能無法體現,比如口音、語調、節奏等。

現在,用戶可以通過設置來定製 AI 模型的說話方式,以便更準確地描述用戶希望模型如何說話。

她舉例稱,比如讓模型以特定的節奏說話,發音清晰,說話慢,並定期使用用戶的名字。她建議從簡單的開始,比如讓模型知道用戶的名字和一些基本信息。

在具體的場景中,用戶詢問周末可以做什麽有趣的事情。ChatGPT 高級語音模式就會根據天氣和用戶所在地區(海灣地區)提供了一些建議,如徒步旅行、野餐或沿著 1 號公路開車。

又或者,她表示喜歡開車遊覽風景的想法,並詢問應該走哪條路線時,ChatGPT 也能給出周全的計劃。

簡言之,通過定製模型的語音和交互方式,ChatGPT 高級語音模式就能根據用戶的喜好和需求提供具體的建議,並使得交互更加自然和有用。

此外,新版 ChatGPT 高級語音模式的對話速度、流暢度以及口音都得到了較大的改善,做你的外語搭子或許真的值得考慮。

OpenAI 模型設計師德魯在聊到使用體驗時表示,當他在做某件事或不需要與 ChatGPT 交談時,ChatGPT 會保持安靜。

當他有問題時,他會提出問題,然後這個問題可以延伸成一場長時間的對話。

在對話過程中,ChatGPT 的聲音會根據談話的語氣進行調整。在他看來,ChatGPT 就像是坐在他旁邊的朋友,不僅提供信息,還能進行思想上的交流。

而落到實際也可以嚐試用它來練習麵試等場景,並且無需擔心延遲問題。

德魯強調「我的意思是,這種延遲非常低,就像和另一個人交談一樣。」

值得注意的是,OpenAI 推出的新版高級語音模式目前還沒有向歐盟、英國、瑞士、冰島、挪威和列支敦士登等地區開放使用。

一石激起千層浪,受波及的網友對此是既憤懣也無奈。

遺憾的是,ChatGPT 的視頻和屏幕共享仍舊沒上線。

四個月前,這項功能在發布會上驚豔亮相。當時,OpenAI 還向我們展示了如何實時向 ChatGPT 詢問麵前紙上的數學問題或電腦屏幕上的代碼。

目前,OpenAI 尚未明確何時推出該功能。

在發展動輒以天算的 AI 行業中,姍姍來遲的高級語音模式本質上還是一個閹割品。

沒有新增過於亮眼的功能,甚至也沒有完成五月份發布會上的功能承諾,早有預熱的全量推送倒更像定點狙擊 Google 新模型的產物。

吊詭的是,OpenAI 字典裏的「即將推出」似乎也和我們的不太一樣。

有些早已承諾的功能可能意味著明天,也可能是明年。

而如果換個角度想,技術能力過硬的 OpenAI 同時也是一家販賣想象的公司,我們最期待或許也是他們下一次的挖坑。

畢竟,這已經成為了他們的一種傳統,不是嗎?

One more thing

OpenAI 官網今天更新了一版關於 ChatGPT 語音模式的 QA 解答,我們也簡單總結了一些實用解答,希望對你有所參考。

1、在使用高級語音模式時,你依然可以掛在手機後台繼續保持對話。

2、如果你從文本或標準語音模式切換到高級語音模式,請注意,你將無法返回到之前的文本或標準語音對話狀態。

3、在車內使用車載藍牙或免提電話功能時,高級語音對話的體驗可能會受到影響,因為目前 OpenAI 還沒有為這些設備提供專門的優化。

3、高級語音對話目前還未對 GPTs 開放。你隻能與 GPTs 進行標準語音對話。GPTs 擁有自己獨特的語音選項,名為 Shimmer。

4、為了尊重音樂創作者的版權,OpenAI 采取了多項安全措施,包括新的過濾條件,以防止語音對話生成音樂內容,包括唱歌。

5、高級語音模式對話本質上是多模態的,轉錄的文本並不總是與原始對話完全一致。

6、高級語音對話中的音頻會與聊天記錄一同保留,直到你主動刪除。刪除後,音頻通常會在 30 天內被刪除,但在某些特定情況下可能會保留更長時間。

7、OpenAI 表示,默認情況下,係統不會使用你在語音聊天中的音頻來訓練模型,除非你選擇共享這些音頻。

8、如果「設置」沒有開啟「改善所有用戶的語音聊天體驗」選項,說明你沒有共享音頻,係統也不會使用你的音頻來訓練模型。

查看評論(0)