環(huán)球視訊！Google 新 AI 大模型來(lái)了

2023-03-09 14:39:38 來(lái)源：手機(jī)網(wǎng)易網(wǎng)

3 月 7 日 WSJ 的一篇長(zhǎng)文剛講述 Google 如何在過(guò)于謹(jǐn)慎和自我束縛下，錯(cuò)失了發(fā)布類(lèi)似 ChatGPT 的聊天機(jī)器人的先機(jī)，作者認(rèn)為高管在保持技術(shù)發(fā)展優(yōu)勢(shì)和維護(hù)倫理安全之間舉棋不定。

(相關(guān)資料圖)

一天后，Google 機(jī)器人團(tuán)隊(duì)、柏林理工大學(xué)和 Google 研究提出一種新的人工智能模型 PaLM-E，它由一組神經(jīng)網(wǎng)絡(luò)組成，可以處理不同形式的數(shù)據(jù)，比如圖像、聲音、文本還有機(jī)器人控制策略，從而實(shí)現(xiàn)對(duì)機(jī)器人的控制和操作。

三方團(tuán)隊(duì)聯(lián)合發(fā)表的論文詳細(xì)解釋如何利用可視化數(shù)據(jù)增強(qiáng)語(yǔ)言處理能力。研究人員先使用大規(guī)模的圖像和文本數(shù)據(jù)集對(duì)一個(gè)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練，以使其學(xué)習(xí)到一些通用的特征和知識(shí)，然后再在特定任務(wù)上進(jìn)行微調(diào)，從而提高其對(duì)圖像和自然語(yǔ)言之間關(guān)系的理解，并在機(jī)器人控制等任務(wù)中發(fā)揮更好的作用。用來(lái)訓(xùn)練模型的 “素材” 包括圖像標(biāo)注、視覺(jué)問(wèn)答和圖像分類(lèi)等。

作者還舉例一些具體使用場(chǎng)景，包括：

-在機(jī)器人控制任務(wù)中，PaLM-E 可以根據(jù)自然語(yǔ)言指令和視覺(jué)輸入生成機(jī)器人控制策略。

-在視覺(jué)問(wèn)答任務(wù)中，PaLM-E 可以根據(jù)圖像和自然語(yǔ)言問(wèn)題生成相應(yīng)的回答。

-在機(jī)器手臂移動(dòng)操作任務(wù)中，PaLM-E 可以根據(jù)自然語(yǔ)言指令和機(jī)器人狀態(tài)生成移動(dòng)路徑和操作序列。

-在包含文本、圖像、聲音的多模態(tài)對(duì)話(huà)系統(tǒng)中，PaLM-E 可以理解用戶(hù)的自然語(yǔ)言輸入并生成相應(yīng)的回復(fù)。

根據(jù)研究小組的說(shuō)法，他們?cè)龑?dǎo)機(jī)器手臂按照指示精確地將紅色塊移向目標(biāo)杯子 —— 即便訓(xùn)練數(shù)據(jù)中只有三個(gè)咖啡杯。

Google 的科研能力和資金儲(chǔ)備毋庸置疑，但如它們自己說(shuō)的，研究原型和一款每天可以安全使用的可靠產(chǎn)品之間存在巨大差距。并且相較于小型創(chuàng)業(yè)公司，Google 必須更加深思熟慮地發(fā)布 AI 技術(shù)。

如在 WSJ 的報(bào)道中，兩名 Google 研究員兩年多前開(kāi)始推動(dòng)公司發(fā)布一款聊天機(jī)器人，后者可以自信地探討哲學(xué)問(wèn)題，談?wù)撟约合矚g的電視節(jié)目，同時(shí)還可以即興制作有關(guān)牛和馬的雙關(guān)語(yǔ)，其技術(shù)比當(dāng)時(shí)其他任何聊天機(jī)器人都要先進(jìn)。

這遭 Google 高管們多次拒絕，理由是不符合公司對(duì) AI 安全和公平性的倫理標(biāo)準(zhǔn)。兩位研究員丹尼爾和諾姆離職創(chuàng)辦自己的 AI 公司。Google 最近緊急發(fā)布的聊天機(jī)器人 Bard，部分基于二人的技術(shù)。

Google 對(duì)于推動(dòng)人工智能技術(shù)應(yīng)用的擔(dān)憂(yōu)主要來(lái)自?xún)煞矫妫皇情L(zhǎng)期以來(lái)關(guān)于人工智能的爭(zhēng)議可能影響公司聲譽(yù)，二是擔(dān)心因此沖擊自己的廣告業(yè)務(wù)。

第一個(gè)擔(dān)心長(zhǎng)期存在于學(xué)術(shù)界和技術(shù)應(yīng)用領(lǐng)域。甚至 OpenAI 成立初衷之一也是希望有朝一日有能力對(duì)抗可能被大公司濫用（比如 Google）的邪惡 AI。

2016 年，微軟發(fā)布了一款名為 Tay 的聊天機(jī)器人，但僅僅上線(xiàn)數(shù)小時(shí)后，就在一些用戶(hù) “調(diào)教” 下，發(fā)表了諸如 “布什是 ‘9·11’ 事件的幕后黑手” “希特勒一點(diǎn)也沒(méi)錯(cuò)” 等聳人聽(tīng)聞的言論。

第二個(gè)則是不可避免的大公司病，即在維護(hù)現(xiàn)有的盈利模式和客戶(hù)群體、保持穩(wěn)定的現(xiàn)金流和市場(chǎng)地位，與持續(xù)創(chuàng)新以應(yīng)對(duì)市場(chǎng)變化和新興競(jìng)爭(zhēng)對(duì)手的威脅之間搖擺，通常最后是前者戰(zhàn)勝后者，從而給了后來(lái)者機(jī)會(huì)。舊去新來(lái)是商業(yè)規(guī)律之一，也是商業(yè)世界的魅力。（邱豪龔方毅）

關(guān)鍵詞：

環(huán)球視訊！Google 新 AI 大模型來(lái)了

環(huán)球視訊！Google 新 AI 大模型來(lái)了