關(guān)于“ChatGPT”,相信很多人都已經(jīng)不陌生了。一眾大佬的背書,加上媒體的炒作,讓這一新生事物瞬間成為繼元宇宙之后的又一“科技寵兒”。國內(nèi)的頭部科技公司也迅速跟進,出現(xiàn)了文心一言、通義千問等類似產(chǎn)品。
有人把它當(dāng)成聊天機器人,也有人將其稱之為開啟新一輪科技革命的鑰匙。它們的出現(xiàn)改變著人類與機器的交互方式,同時也影響著其他產(chǎn)業(yè)的發(fā)展進程。360集團創(chuàng)始人周鴻祎曾說,ChatGPT不僅僅是搜索引擎的加強版,也不僅僅是一個聊天機器人,它通過SaaS方式所提供的人工智能服務(wù)將重塑所有的數(shù)字化應(yīng)用和所有行業(yè)。
5月23日,百度Apollo汽車智能化業(yè)務(wù)展示了以文心大模型為基礎(chǔ)的新一代AI智艙探索成果。其中包括出行場景對話式交互、邏輯推理、策略規(guī)劃和知識問答等多項能力,另外還有在當(dāng)前智艙命令式交互下覆蓋全車多音區(qū)、毫秒級響應(yīng)、免喚醒全時交互的體驗。
(資料圖片僅供參考)
百度阿波羅智艙業(yè)務(wù)部產(chǎn)品架構(gòu)師徐嘉南表示:“大模型的能力給汽車加上了智商和情商,這也是過去系統(tǒng)不具備的能力?!?/p>
從交互工具到智能助手
隨著新能源汽車的快速滲透,汽車智能化的步伐也在加快。過程中,主機廠、科技公司、一級供應(yīng)商等玩家紛紛下場,開展智能座艙、自動駕駛方面的研發(fā)和應(yīng)用。而在整個智能化的拼圖中,智能座艙儼然已經(jīng)成為排頭兵,考驗著每家企業(yè)的技術(shù)和產(chǎn)品實力。
據(jù)汽車之家研究院《2023中國智能汽車發(fā)展趨勢洞察》報告顯示,智能座艙相關(guān)配置近年來滲透率均處于增長態(tài)勢,特別是網(wǎng)聯(lián)化配置。其中車聯(lián)網(wǎng)每年穩(wěn)步保持上升十個百分點以上,至2022年市場滲透率已超過70%。OTA升級2022年達到近50%,較2018年提升了19倍。
百度也對進智能座艙進行了不少用戶調(diào)研和拆解分析,結(jié)果顯示,智能化的功能搭載率排在首位的是語音交互。“語音交互未來的覆蓋量還會快速拓展,從我們原來的高技術(shù),到后面的普及率是越來越高。預(yù)計到2025年會超過95%的車搭載?!毙旒文险f道。
同時,百度認為未來智能汽車不是有四個輪子的大號手機,而是一個真正可以互動、可以學(xué)習(xí)的“汽車機器人”。語音交互是智能機器最重要的交互方式。
實際上,語音交互在汽車上的應(yīng)用已經(jīng)有接近10年的發(fā)展歷程,從最開始命令式的語音搖控器,到后來成為準確率越來越高,理解能力越來越強的交互工具,它可以替代手去點擊屏幕。在百度看來,語音交互接下來的發(fā)展方向就是理想態(tài)的智能助理,它不再是單向下命令,而是可以雙向互動、對話,理解復(fù)雜的需求表達。同時它還會具備更有智商、情商的創(chuàng)造能力。
“它不再是交互工具,而是真正能夠陪伴用戶的一個助手。接下來五年會朝這樣的方向去進行發(fā)展。我們接下來的語音會有大語言模型,推動真正地對話式交互?!毙旒文辖榻B道。
相比而言,這會產(chǎn)生兩方面變化。一個是用戶體驗,過去的語音交互純靠人工設(shè)計,堆產(chǎn)品經(jīng)理、堆研發(fā)、堆設(shè)計師,這也導(dǎo)致語音交互所能實現(xiàn)的功能還是非常有限的。而大語言模型能真正把通用的語音模型帶到設(shè)備上,可以在不同的場景下化身不同的助手,解決用戶專業(yè)的問題。
其次是產(chǎn)業(yè)層面。過去車企需要培養(yǎng)一批語音開發(fā)人員,去具體進行功能設(shè)計。而未來車企會配備提示詞工程師這樣的崗位,專門調(diào)教大模型,讓車機有更好的響應(yīng)和結(jié)果,滿足用戶需求。
“想要達到這樣的變革,就需要更堅實的技術(shù)支撐。百度在整個行業(yè)里有非常好的AI技術(shù)積累,擁有全棧自研的AI架構(gòu),從底層的芯片——昆侖芯,到上層深度學(xué)習(xí)架框——飛漿,以及模型層。我們是基于文心大模型的能力達到這樣的體驗?!毙旒文媳硎?。
大模型賦能后的優(yōu)勢
正是基于這樣的判斷,百度在智能座艙上開展了多項產(chǎn)品化探索。
目前百度的智能座艙分成兩大部分,一部分是小度車載SDK,另一部分是小度車載OS。2019年,百度推出了小度車載OS,已在多個車型上實現(xiàn)300多萬的搭載量。
據(jù)徐嘉南介紹,根據(jù)市場行業(yè)發(fā)展,目前車企更多希望做個性化、定制化的智能化產(chǎn)品,以便突出自身的品牌調(diào)性。為了滿足這些客戶的需求,百度推出了小度車載SDK,其具備更開放性的設(shè)計,可以讓車企進行差異化設(shè)計。整體內(nèi)容分為三部分,一是語音SDK,其次是車載生態(tài),第三部分是核心的智慧增強包。
其中小度車載語音基于大模型本地化技術(shù)開發(fā)。所謂的大模型本地化,是把云端參數(shù)非常大的模型通過蒸餾和裁剪方式,把整個體積和運行資源占用變得更小,然后移動到端上,利用本地化算力去做加速運行,從而帶來更極致的語音交互體驗。
這樣做有以下優(yōu)勢,首先是體驗更流暢,用戶可以在任何位置、任何時間直接交流,沒有交互屏障,不像原來要不斷進行喚醒,真正做到全時免喚醒,不需要再喚醒。另外,小度車載語音還支持多路同時交互,車內(nèi)每個位置都有專屬的服務(wù)語音交互,其背后比較大的挑戰(zhàn)就是拒識能力,具體來說就是區(qū)分人是不是在和車說話,如果是和車說話,就應(yīng)該有響應(yīng),如果不是和車說話,就應(yīng)該忽略。
目前,小度車載語音通過語音加語義的多模拒識,可以達到非常高的拒識準確率,并且是全時。
其次是極速、更快的響應(yīng),小度車載語音可以做到全領(lǐng)域毫秒級響應(yīng),速度會達到端到端的800毫秒。只有做到全領(lǐng)域才能帶來持續(xù)的交互體驗。
據(jù)徐嘉南介紹,“相比于整個行業(yè)的主流產(chǎn)品來說,我們提升了一倍速度。如果是喚醒,最快的速度是接近1.5秒,這基本上是極限了,而我們真正可以做到全領(lǐng)域。同時,因為它具備本地化能力,可以把大量的人機交互數(shù)據(jù)保存在本地,極大地保護了用戶隱私?!?/p>
第三是全場景。一直以來,更多車企會將語音交互集中在自研應(yīng)用上,很多第三方應(yīng)用是無法使用的。這主要是因為整個開發(fā)過程中有非常高的適配成本,車企需要生態(tài),就需要跟應(yīng)用方進行深度開發(fā)和合作,付開發(fā)費。一旦頁面改變,以前的工作都可能全部推倒重來。
現(xiàn)在通過本地注冊能力,小度車載可以通過自動識屏方式,自動識別屏幕上的按鈕,幫助OEM節(jié)省成本,給用戶帶來全場景體驗。車里所有的功能都可以語音交互,而不是只在某些應(yīng)用里面才能使用。
第四,小度車載語音在文心大模型的加持下變得更聰明了。
為車企提供兩種方案
這里不得不提到百度推出的車載智慧增強包。相對于原來命令型、任務(wù)型的智能,車載智慧增強包給其加上了真正的智商和情商,可以讓每個車載場景更智慧,更能夠去幫助用戶解決實實在在的用車需求。其背后需要強大的邏輯理解能力,包括對話式交互能力、策略規(guī)劃和知識問答。
總結(jié)下來,車載智慧增強包含有兩個基礎(chǔ)功能和兩個結(jié)合功能。兩個基礎(chǔ)功能是指超級閑聊、靈感畫畫?;诖丝梢詫崿F(xiàn)百變?nèi)嗽O(shè),用不同人設(shè)的風(fēng)格進行語音回復(fù),其次是AI新車導(dǎo)購,可以通過一個模擬導(dǎo)購員的方式與人進行互動。
“從整個發(fā)展角度來看,我們認為未來文心大模型會重塑車內(nèi)的應(yīng)用和交互,基于文心這樣的能力,把過去可能我們想到的體驗,但是過去的技術(shù)做不到的能力,去進行一次優(yōu)化,一次重構(gòu),給大家?guī)砣麦w驗?!毙旒文险f道。
據(jù)他透露,目前很多車企都很感興趣,在和百度進行探索。車企感興趣的主要包括幾個方面,第一是大模型的整個能力能不能快速上車,這是車企最關(guān)注的。
第二部分是上車合作的方式。目前主要有兩種方案,一是小度車載智慧增強包,這是標(biāo)準化產(chǎn)品,可以快速給到車企,車企可以直接放到車上和系統(tǒng)進行融合。其次是滿足車企的個性化需求,比如要自己去設(shè)計一些場景,設(shè)計一些能力,百度則通過引擎的方式和車企進行合作。
當(dāng)然,百度基于大模型能力還在進行更多功能探索。比如在出行場景下的行程規(guī)劃、個性化的駕駛空間、用車顧問、兒童益智場景等等。從某種程度上說,大模型已經(jīng)成為汽車智能化的核心驅(qū)動力,而百度Apollo也將作為一個“賦能者”,持續(xù)助力車企在智能化賽道上獲得領(lǐng)先。(文/汽車之家 楊益春)
查看同類文章:行業(yè)視角智能網(wǎng)聯(lián)更多精彩內(nèi)容:產(chǎn)業(yè)報道銷量榜-市場熱度汽車之家行業(yè)-大數(shù)據(jù) 全領(lǐng)域 新視點關(guān)鍵詞: