上線僅僅一天,GPT-4o的高級(jí)語(yǔ)音功能(Advanced Voice Mode)簡(jiǎn)直要被玩瘋了。
無(wú)數(shù)網(wǎng)友腦洞大開(kāi)的瘋狂測(cè)試,GPT-4o這邊呢,不僅各種奇葩任務(wù)全盤(pán)接收,表現(xiàn)好到更是讓不少人連連驚呼“Blow my mind”。
例如有位網(wǎng)友要求GPT-4o用中文講個(gè)故事,它的表現(xiàn)是這樣的:
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
很多懂中文的網(wǎng)友看罷,紛紛表示不論是情緒還是整體的描述,GPT-4o的表現(xiàn)都比較OK。
但也并非完美,例如它的語(yǔ)速略顯慢了些,以及把“氣”讀成了“kì”。
還有更像人的例子,仔細(xì)聽(tīng):
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
你沒(méi)聽(tīng)錯(cuò),GPT-4o在讀美國(guó)女詩(shī)人Emiliy Dickinson的作品時(shí),她哭了!
(頗有種情到深處自然濃的感覺(jué))
這效果可把網(wǎng)友們嚇得不輕,表示“毛骨悚然”。
然而這還只是網(wǎng)友們瘋狂測(cè)試的一隅,還有很多好玩的例子,我們繼續(xù)往下看。
數(shù)1-100,賊快
如果讓你用英文從1數(shù)到10,越快越好,你需要幾秒?
有網(wǎng)友就給GPT-4o提了這個(gè)要求,來(lái)感受下AI的語(yǔ)速:
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
當(dāng)網(wǎng)友要求它以更快的速度讀1-10時(shí),“AI字幕”識(shí)別功能都失效了。
而當(dāng)GPT-4o被要求速讀1-50時(shí),我們還可以聽(tīng)到他還會(huì)像人一樣有大口換氣的動(dòng)作。
接下來(lái),這位網(wǎng)友提出了更高的要求——速讀1-100:
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
雖然前期沒(méi)有完全get網(wǎng)友的要求,但在他不斷地引導(dǎo)之下,GPT-4o終還是完成了速讀1-100的任務(wù)。
除此之外,在搞怪方面,GPT-4o學(xué)貓叫也是一絕:
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
(我們一起學(xué)貓叫,一起喵喵喵~)
當(dāng)然,以實(shí)時(shí)性和多語(yǔ)種出圈的語(yǔ)音功能,網(wǎng)友定然也不會(huì)放過(guò)測(cè)試這項(xiàng)任務(wù)。
主打一個(gè)隨意打斷、隨意切換:
烏爾都語(yǔ)→希伯來(lái)語(yǔ)→挪威語(yǔ)→摩洛哥達(dá)利加語(yǔ)→阿姆哈拉語(yǔ)→匈牙利語(yǔ)→格魯吉亞語(yǔ)→克林貢語(yǔ)。
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
還有更加實(shí)用的功能。
例如如果你在玩一款日本游戲,但卻看不懂日文,那就直接讓GPT-4o來(lái)幫忙就好了:
視頻地址:https://mp.weixin.qq.com/s/YAC56GANpNfrrpc8q3Jf6w
好家伙,GPT-4o直接搖身一變,成了實(shí)時(shí)翻譯官了。
“自然的語(yǔ)音是關(guān)鍵”
除了上面這些具體的案例,沃頓商學(xué)院教授Ethan Mollick也談了談他的感受。
他將GPT-4o的高級(jí)語(yǔ)音功能總結(jié)為三點(diǎn):
它和OpenAI當(dāng)時(shí)演示的效果一樣好。它顯然能夠生成更多音頻,但存在限制。它令人毛骨悚然。大量無(wú)意識(shí)的線索讓人感覺(jué)像是在與一個(gè)人交談。
并且Ethan教授還認(rèn)為,這種非常自然、擬人的語(yǔ)音,正是改變?nèi)祟?lèi)與AI交互性質(zhì)的關(guān)鍵(雖然底層模型是我們用了很久的那個(gè))。
但實(shí)際上,高級(jí)語(yǔ)音模式與ChatGPT現(xiàn)有的語(yǔ)音功能存在明顯差異。
ChatGPT 之前的語(yǔ)音處理方式依賴(lài)于三個(gè)不同的模型:首先是將語(yǔ)音信號(hào)轉(zhuǎn)化為文字的模型,其次是 GPT-4 用于解析和回應(yīng)用戶(hù)指令,后是將 ChatGPT 的輸出文本轉(zhuǎn)換為語(yǔ)音的模型。
相比之下,GPT-4o 具備多模態(tài)能力,能夠獨(dú)立完成這些任務(wù),無(wú)需其他模型的輔助,這大大減少了對(duì)話過(guò)程中的等待時(shí)間。
此外,OpenAI 還強(qiáng)調(diào) GPT-4o 能夠識(shí)別并響應(yīng)用戶(hù)語(yǔ)音中的情感變化,例如能夠感知到悲傷、興奮等情緒。
而隨著越來(lái)越多網(wǎng)友曬出他們的測(cè)試結(jié)果,底下的吃瓜群眾們是按耐不住了,紛紛表示希望OpenAI快點(diǎn)讓更多人體驗(yàn)上。
那么你覺(jué)得用GPT-4o的高級(jí)語(yǔ)音功能,還能有什么更有意思的玩法?歡迎在評(píng)論區(qū)留言討論~
本文鏈接:http://m.zh1234.com/news41345.htmlChatGPT版Her被玩瘋:哭著讀詩(shī) 中文表現(xiàn)也很亮