百度文心大模型上車如何賦能智能化？

2023-05-26 16:24:01 來源：汽車之家

關(guān)于“ChatGPT”，相信很多人都已經(jīng)不陌生了。一眾大佬的背書，加上媒體的炒作，讓這一新生事物瞬間成為繼元宇宙之后的又一“科技寵兒”。國(guó)內(nèi)的頭部科技公司也迅速跟進(jìn)，出現(xiàn)了文心一言、通義千問等類似產(chǎn)品。

有人把它當(dāng)成聊天機(jī)器人，也有人將其稱之為開啟新一輪科技革命的鑰匙。它們的出現(xiàn)改變著人類與機(jī)器的交互方式，同時(shí)也影響著其他產(chǎn)業(yè)的發(fā)展進(jìn)程。360集團(tuán)創(chuàng)始人周鴻祎曾說，ChatGPT不僅僅是搜索引擎的加強(qiáng)版，也不僅僅是一個(gè)聊天機(jī)器人，它通過SaaS方式所提供的人工智能服務(wù)將重塑所有的數(shù)字化應(yīng)用和所有行業(yè)。

5月23日，百度Apollo汽車智能化業(yè)務(wù)展示了以文心大模型為基礎(chǔ)的新一代AI智艙探索成果。其中包括出行場(chǎng)景對(duì)話式交互、邏輯推理、策略規(guī)劃和知識(shí)問答等多項(xiàng)能力，另外還有在當(dāng)前智艙命令式交互下覆蓋全車多音區(qū)、毫秒級(jí)響應(yīng)、免喚醒全時(shí)交互的體驗(yàn)。

(資料圖片僅供參考)

百度阿波羅智艙業(yè)務(wù)部產(chǎn)品架構(gòu)師徐嘉南表示：“大模型的能力給汽車加上了智商和情商，這也是過去系統(tǒng)不具備的能力?！?/p>

從交互工具到智能助手

隨著新能源汽車的快速滲透，汽車智能化的步伐也在加快。過程中，主機(jī)廠、科技公司、一級(jí)供應(yīng)商等玩家紛紛下場(chǎng)，開展智能座艙、自動(dòng)駕駛方面的研發(fā)和應(yīng)用。而在整個(gè)智能化的拼圖中，智能座艙儼然已經(jīng)成為排頭兵，考驗(yàn)著每家企業(yè)的技術(shù)和產(chǎn)品實(shí)力。

據(jù)汽車之家研究院《2023中國(guó)智能汽車發(fā)展趨勢(shì)洞察》報(bào)告顯示，智能座艙相關(guān)配置近年來滲透率均處于增長(zhǎng)態(tài)勢(shì)，特別是網(wǎng)聯(lián)化配置。其中車聯(lián)網(wǎng)每年穩(wěn)步保持上升十個(gè)百分點(diǎn)以上，至2022年市場(chǎng)滲透率已超過70%。OTA升級(jí)2022年達(dá)到近50%，較2018年提升了19倍。

百度也對(duì)進(jìn)智能座艙進(jìn)行了不少用戶調(diào)研和拆解分析，結(jié)果顯示，智能化的功能搭載率排在首位的是語音交互?！罢Z音交互未來的覆蓋量還會(huì)快速拓展，從我們?cè)瓉淼母呒夹g(shù)，到后面的普及率是越來越高。預(yù)計(jì)到2025年會(huì)超過95%的車搭載?！毙旒文险f道。

同時(shí)，百度認(rèn)為未來智能汽車不是有四個(gè)輪子的大號(hào)手機(jī)，而是一個(gè)真正可以互動(dòng)、可以學(xué)習(xí)的“汽車機(jī)器人”。語音交互是智能機(jī)器最重要的交互方式。

實(shí)際上，語音交互在汽車上的應(yīng)用已經(jīng)有接近10年的發(fā)展歷程，從最開始命令式的語音搖控器，到后來成為準(zhǔn)確率越來越高，理解能力越來越強(qiáng)的交互工具，它可以替代手去點(diǎn)擊屏幕。在百度看來，語音交互接下來的發(fā)展方向就是理想態(tài)的智能助理，它不再是單向下命令，而是可以雙向互動(dòng)、對(duì)話，理解復(fù)雜的需求表達(dá)。同時(shí)它還會(huì)具備更有智商、情商的創(chuàng)造能力。

“它不再是交互工具，而是真正能夠陪伴用戶的一個(gè)助手。接下來五年會(huì)朝這樣的方向去進(jìn)行發(fā)展。我們接下來的語音會(huì)有大語言模型，推動(dòng)真正地對(duì)話式交互。”徐嘉南介紹道。

相比而言，這會(huì)產(chǎn)生兩方面變化。一個(gè)是用戶體驗(yàn)，過去的語音交互純靠人工設(shè)計(jì)，堆產(chǎn)品經(jīng)理、堆研發(fā)、堆設(shè)計(jì)師，這也導(dǎo)致語音交互所能實(shí)現(xiàn)的功能還是非常有限的。而大語言模型能真正把通用的語音模型帶到設(shè)備上，可以在不同的場(chǎng)景下化身不同的助手，解決用戶專業(yè)的問題。

其次是產(chǎn)業(yè)層面。過去車企需要培養(yǎng)一批語音開發(fā)人員，去具體進(jìn)行功能設(shè)計(jì)。而未來車企會(huì)配備提示詞工程師這樣的崗位，專門調(diào)教大模型，讓車機(jī)有更好的響應(yīng)和結(jié)果，滿足用戶需求。

“想要達(dá)到這樣的變革，就需要更堅(jiān)實(shí)的技術(shù)支撐。百度在整個(gè)行業(yè)里有非常好的AI技術(shù)積累，擁有全棧自研的AI架構(gòu)，從底層的芯片——昆侖芯，到上層深度學(xué)習(xí)架框——飛漿，以及模型層。我們是基于文心大模型的能力達(dá)到這樣的體驗(yàn)。”徐嘉南表示。

大模型賦能后的優(yōu)勢(shì)

正是基于這樣的判斷，百度在智能座艙上開展了多項(xiàng)產(chǎn)品化探索。

目前百度的智能座艙分成兩大部分，一部分是小度車載SDK，另一部分是小度車載OS。2019年，百度推出了小度車載OS，已在多個(gè)車型上實(shí)現(xiàn)300多萬的搭載量。

據(jù)徐嘉南介紹，根據(jù)市場(chǎng)行業(yè)發(fā)展，目前車企更多希望做個(gè)性化、定制化的智能化產(chǎn)品，以便突出自身的品牌調(diào)性。為了滿足這些客戶的需求，百度推出了小度車載SDK，其具備更開放性的設(shè)計(jì)，可以讓車企進(jìn)行差異化設(shè)計(jì)。整體內(nèi)容分為三部分，一是語音SDK，其次是車載生態(tài)，第三部分是核心的智慧增強(qiáng)包。

其中小度車載語音基于大模型本地化技術(shù)開發(fā)。所謂的大模型本地化，是把云端參數(shù)非常大的模型通過蒸餾和裁剪方式，把整個(gè)體積和運(yùn)行資源占用變得更小，然后移動(dòng)到端上，利用本地化算力去做加速運(yùn)行，從而帶來更極致的語音交互體驗(yàn)。

這樣做有以下優(yōu)勢(shì)，首先是體驗(yàn)更流暢，用戶可以在任何位置、任何時(shí)間直接交流，沒有交互屏障，不像原來要不斷進(jìn)行喚醒，真正做到全時(shí)免喚醒，不需要再喚醒。另外，小度車載語音還支持多路同時(shí)交互，車內(nèi)每個(gè)位置都有專屬的服務(wù)語音交互，其背后比較大的挑戰(zhàn)就是拒識(shí)能力，具體來說就是區(qū)分人是不是在和車說話，如果是和車說話，就應(yīng)該有響應(yīng)，如果不是和車說話，就應(yīng)該忽略。

目前，小度車載語音通過語音加語義的多模拒識(shí)，可以達(dá)到非常高的拒識(shí)準(zhǔn)確率，并且是全時(shí)。

其次是極速、更快的響應(yīng)，小度車載語音可以做到全領(lǐng)域毫秒級(jí)響應(yīng)，速度會(huì)達(dá)到端到端的800毫秒。只有做到全領(lǐng)域才能帶來持續(xù)的交互體驗(yàn)。

據(jù)徐嘉南介紹，“相比于整個(gè)行業(yè)的主流產(chǎn)品來說，我們提升了一倍速度。如果是喚醒，最快的速度是接近1.5秒，這基本上是極限了，而我們真正可以做到全領(lǐng)域。同時(shí)，因?yàn)樗邆浔镜鼗芰?，可以把大量的人機(jī)交互數(shù)據(jù)保存在本地，極大地保護(hù)了用戶隱私。”

第三是全場(chǎng)景。一直以來，更多車企會(huì)將語音交互集中在自研應(yīng)用上，很多第三方應(yīng)用是無法使用的。這主要是因?yàn)檎麄€(gè)開發(fā)過程中有非常高的適配成本，車企需要生態(tài)，就需要跟應(yīng)用方進(jìn)行深度開發(fā)和合作，付開發(fā)費(fèi)。一旦頁(yè)面改變，以前的工作都可能全部推倒重來。

現(xiàn)在通過本地注冊(cè)能力，小度車載可以通過自動(dòng)識(shí)屏方式，自動(dòng)識(shí)別屏幕上的按鈕，幫助OEM節(jié)省成本，給用戶帶來全場(chǎng)景體驗(yàn)。車?yán)锼械墓δ芏伎梢哉Z音交互，而不是只在某些應(yīng)用里面才能使用。

第四，小度車載語音在文心大模型的加持下變得更聰明了。

為車企提供兩種方案

這里不得不提到百度推出的車載智慧增強(qiáng)包。相對(duì)于原來命令型、任務(wù)型的智能，車載智慧增強(qiáng)包給其加上了真正的智商和情商，可以讓每個(gè)車載場(chǎng)景更智慧，更能夠去幫助用戶解決實(shí)實(shí)在在的用車需求。其背后需要強(qiáng)大的邏輯理解能力，包括對(duì)話式交互能力、策略規(guī)劃和知識(shí)問答。

總結(jié)下來，車載智慧增強(qiáng)包含有兩個(gè)基礎(chǔ)功能和兩個(gè)結(jié)合功能。兩個(gè)基礎(chǔ)功能是指超級(jí)閑聊、靈感畫畫?；诖丝梢詫?shí)現(xiàn)百變?nèi)嗽O(shè)，用不同人設(shè)的風(fēng)格進(jìn)行語音回復(fù)，其次是AI新車導(dǎo)購(gòu)，可以通過一個(gè)模擬導(dǎo)購(gòu)員的方式與人進(jìn)行互動(dòng)。

“從整個(gè)發(fā)展角度來看，我們認(rèn)為未來文心大模型會(huì)重塑車內(nèi)的應(yīng)用和交互，基于文心這樣的能力，把過去可能我們想到的體驗(yàn)，但是過去的技術(shù)做不到的能力，去進(jìn)行一次優(yōu)化，一次重構(gòu)，給大家?guī)砣麦w驗(yàn)?！毙旒文险f道。

據(jù)他透露，目前很多車企都很感興趣，在和百度進(jìn)行探索。車企感興趣的主要包括幾個(gè)方面，第一是大模型的整個(gè)能力能不能快速上車，這是車企最關(guān)注的。

第二部分是上車合作的方式。目前主要有兩種方案，一是小度車載智慧增強(qiáng)包，這是標(biāo)準(zhǔn)化產(chǎn)品，可以快速給到車企，車企可以直接放到車上和系統(tǒng)進(jìn)行融合。其次是滿足車企的個(gè)性化需求，比如要自己去設(shè)計(jì)一些場(chǎng)景，設(shè)計(jì)一些能力，百度則通過引擎的方式和車企進(jìn)行合作。

當(dāng)然，百度基于大模型能力還在進(jìn)行更多功能探索。比如在出行場(chǎng)景下的行程規(guī)劃、個(gè)性化的駕駛空間、用車顧問、兒童益智場(chǎng)景等等。從某種程度上說，大模型已經(jīng)成為汽車智能化的核心驅(qū)動(dòng)力，而百度Apollo也將作為一個(gè)“賦能者”，持續(xù)助力車企在智能化賽道上獲得領(lǐng)先。（文/汽車之家楊益春）

查看同類文章：行業(yè)視角智能網(wǎng)聯(lián)更多精彩內(nèi)容：產(chǎn)業(yè)報(bào)道銷量榜-市場(chǎng)熱度汽車之家行業(yè)-大數(shù)據(jù) 全領(lǐng)域新視點(diǎn)

關(guān)鍵詞：

百度文心大模型上車 如何賦能智能化？

百度文心大模型上車如何賦能智能化？