AI 的 「iPhone 時(shí)刻」已經(jīng)到來(lái)
在剛剛剛剛結(jié)束的英偉達(dá) GTC 2023 大會(huì)上,英偉達(dá) CEO 黃仁勛把這個(gè)觀點(diǎn)反復(fù)說(shuō)了 3 遍。
怎么理解?
【資料圖】
iPhone 搭載的多點(diǎn)觸摸屏幕技術(shù)開創(chuàng)了一個(gè)全新的智能手機(jī)界面交互模式,由此孕育了移動(dòng)互聯(lián)網(wǎng)。
而 ChatGPT、Stable Diffusion 等 AI 超級(jí)應(yīng)用的出現(xiàn),標(biāo)志著加速計(jì)算和 AI 技術(shù)的成熟已邁入成熟,AI 正以一個(gè)前所未有的速度滲入各行各業(yè),推動(dòng)一場(chǎng)新的產(chǎn)業(yè)革命。
經(jīng)過(guò)近幾年 AI 技術(shù)的不斷發(fā)展,強(qiáng)大算力和先進(jìn)模型為 AI 提供了合適的應(yīng)用平臺(tái),促使各個(gè)廠商們重新構(gòu)想自己的產(chǎn)品和商業(yè)模型,以及更新迭代的速度。
昨天晚上,英偉達(dá)、微軟、Google、Adobe 等廠商在相差無(wú)幾的時(shí)間里都推出了各自的 AI 服務(wù),你追我趕之勢(shì)仿佛在傳達(dá)著同一個(gè)焦慮:
「在這個(gè)大 AI 時(shí)代,如果不想被人顛覆,就要先顛覆別人。」
AI 將會(huì)怎樣改變我們的生活?看過(guò)這「AIGC 最卷一夜」后,你或許能有更深的感觸。
英偉達(dá)正在把 AI 帶到各行各業(yè)
英偉達(dá)在一年一度的 GTC 大會(huì)上又帶來(lái)了很多讓人眼前一亮的「新活」。
例如發(fā)布了一項(xiàng)名為 CuLitho 的 AI 輔助制芯技術(shù),為 2nm 制程鋪平了道路;與路特斯、奔馳、寶馬等汽車廠商合作,用 Omniverse 搭建數(shù)字生產(chǎn)線等。
但要說(shuō)到整場(chǎng) GTC 大會(huì)最亮眼的內(nèi)容,還得是英偉達(dá)發(fā)布的新顯卡——帶有雙 GPU NVLink 的 H100 NVL。
H100 NVL 是專門針對(duì)算力需求巨大的 ChatGPT 而設(shè)計(jì)的顯卡,H100 NVL 擁有夸張的 188GB HBM3 內(nèi)存(每張卡 94GB),這也是目前英偉達(dá)發(fā)布的內(nèi)存最大的顯卡。
像 GPT 這樣的大語(yǔ)言模型非常占用內(nèi)存資源,理論上參數(shù)達(dá)到上千億的 GPT 模型可以迅速占滿一張 H100 顯卡。
與用于 GPT-3 處理的 HGX A100 相比,使用了四對(duì) H100 和雙 GPU NVLink 的標(biāo)準(zhǔn)服務(wù)器的速度快了 10 倍, 「核彈級(jí)」的 H100 NVL 是大規(guī)模部署像 ChatGPT 語(yǔ)言模型的理想選擇。
英偉達(dá)整的另一個(gè)大活就是把「ChatGPT 同款」搬到了云上,向公眾開放。
ChatGPT 的運(yùn)行主要依靠由 A100 或 H100 組成的 DGX 超級(jí)計(jì)算機(jī),微軟為此花了數(shù)億美金采購(gòu)了上萬(wàn)張 A100 顯卡組建 Azure 云計(jì)算平臺(tái)。
為了降低用戶部署大模型的成本,英偉達(dá)推出了 DXG Cloud 服務(wù),每個(gè)月 36999 美元起,你就能獲得一個(gè)由 8 張 H100 或 A100 顯卡組成的云端超級(jí)計(jì)算機(jī),輕松完成高負(fù)載的計(jì)算工作。
2016 年,老黃親手向 OpenAI 交付了第一臺(tái) DGX 超級(jí)計(jì)算機(jī)電腦。7 年之后,頂尖的 AI 算力通過(guò) DXG Cloud 有機(jī)會(huì)走進(jìn)每家公司,完成在過(guò)去不可能完成的任務(wù)。
不難想象,像 ChatGPT 這樣能夠改善人類交流、提高工作效率的先進(jìn)應(yīng)用會(huì)持續(xù)涌現(xiàn),為我們的生活帶來(lái)更多的便利和驚喜。
點(diǎn)石成金,二代 Runway 讓你一句話生成各式大片
B 站一直流行一句梗:視頻不能 P,所以這是真的。但如今視頻不僅可以 P,還可以從無(wú)到有直接用 AI 生成,不用畫師、不用攝影、不用后期。只要你往 Runway 中輸入一段文字,它便還你一段震撼人心的短片。
最早,Runway 是一款后期輔助工具,雖然借助了人工智能的神奇力量,但所能實(shí)現(xiàn)的,并不復(fù)雜:擦除物體、圖像插幀、刪除背景、運(yùn)動(dòng)追蹤等,可以將它視作 Adobe Premiere 的傻瓜式插件。
而當(dāng) Runway 打開人工智能的新大門后,它擁有了點(diǎn)石成金的能力。在去年 9 月公布的 Gen 1 版本中,它有了文本轉(zhuǎn)視頻的能力。那時(shí)的人們,剛剛見識(shí)過(guò)文本轉(zhuǎn)圖像的魔力,而 Runway 直接能生成動(dòng)態(tài)影像,簡(jiǎn)直是降維打擊般的震撼。
時(shí)隔半年,Runway Gen 2 來(lái)了。
比起 Gen 1 模型,它實(shí)現(xiàn)了更高的時(shí)間一致性和保真度,說(shuō)人話就是畫面之間的連接得更順暢了,畫質(zhì)還更高清了。
用上 Gen 2,距離隨時(shí)隨地生成自己想象的視頻更近了。
輸入一條不算長(zhǎng)的提示詞:無(wú)人機(jī)航拍的山脈。據(jù)此 Runway 生成出以下畫面。
再來(lái)一個(gè):午后陽(yáng)光照進(jìn)紐約市中一幢公寓的窗戶。
來(lái)個(gè)進(jìn)階版,給 Runway 喂進(jìn)圖片和文字,進(jìn)而生成一段短片。
▲ 文字為:一個(gè)男人走在街上,周圍酒吧的霓虹燈照亮了他
▲ 原圖
或者是讓一幅靜態(tài)圖片動(dòng)起來(lái)。
還可以將一張無(wú)紋理待渲染動(dòng)圖,直接渲染出動(dòng)態(tài)影像。
Runway 的進(jìn)步有目共睹,在對(duì)抗網(wǎng)絡(luò)模型路上越走越遠(yuǎn)、越走越順,如今的 Gen 2 版本已經(jīng)算是「可看」的程度,雖稱不上精致,但未來(lái)可期。
或許到了 Gen 3 版本,我們就能在它的幫助下,一鍵生成抖音爆款短片。到時(shí)候,這會(huì)是優(yōu)質(zhì)博主的噩夢(mèng)嗎?
突發(fā)!Google 開啟 Bard 測(cè)試
如果說(shuō)英偉達(dá)讓我們看到了 AI 發(fā)展的未來(lái),那 Google 的 Bard 就是 AI 的今天。
在大家被 GPT-4 和 Midjourney V5 震撼刷屏一周后、老黃展望未來(lái) AI 時(shí)代的同時(shí),Google 宣布正式開放 Bard 的訪問(wèn):請(qǐng)嘗試 Bard,并提供你的反饋。
根據(jù) Google 的最新演示,相比 ChatGPT,Bard 更像是一個(gè)專注于工作學(xué)習(xí)的隨身助理,你可以在它的協(xié)助下,激發(fā)想法、滿足好奇心。
你可以讓 Bard 用簡(jiǎn)單的語(yǔ)言解釋量子物理學(xué),或者讓它提供頭腦風(fēng)暴,幫你在一年內(nèi)閱讀 20 本書。
Google 表示,用戶可以在 Bard 的協(xié)助下,加速想法、激發(fā)好奇心。你可以使用 Bard 提供一些技巧,比如如何實(shí)現(xiàn)一年閱讀 20 本書,或者用簡(jiǎn)單的語(yǔ)言解釋量子物理學(xué)。
在演示的內(nèi)容中我們還發(fā)現(xiàn)了一些細(xì)節(jié),Bard 似乎會(huì)同時(shí)生成多個(gè)回答,你可以根據(jù)需求選擇最適合你的那一個(gè),并進(jìn)行持續(xù)提問(wèn)。
當(dāng)然,ChatGPT 也可以生成多個(gè)回答,但它是在回答結(jié)束后重新生成,相較來(lái)看,Bard 更像是一個(gè)會(huì)同時(shí)提供多種方案的乙方。
可能是 ChatGPT 和 Bing Chat 的負(fù)面消息引起了 Google 的重視,后者不斷強(qiáng)調(diào) Bard 只是一場(chǎng)實(shí)驗(yàn),Bard 生成的信息并不代表 Google 的觀點(diǎn)。
Google 表示,雖然 Bard 由大型語(yǔ)言模型提供支持,并會(huì)隨著時(shí)間推移而日漸強(qiáng)大,但它會(huì)學(xué)習(xí)到一些偏見或者刻板印象,導(dǎo)致它「自信滿滿」地說(shuō)出一些不準(zhǔn)確或者虛假的信息,比如它會(huì)將「ZZ Plant」理解為 Zamioculcas zamioculcas,而不是正確的 Zamioculcas zamiifolia。
有了 Bing Chat「瘋了」的前車之鑒,Bard 的第一個(gè)測(cè)試版就限制了同一對(duì)話中的交流次數(shù),從而保證內(nèi)容的準(zhǔn)確。當(dāng)你第一次登陸 Bard 時(shí),它就會(huì)告訴你這只是一個(gè)實(shí)驗(yàn),并期待你的反饋。
作為 Bard 的第一個(gè)版本,它暫時(shí)還不支持更多語(yǔ)言(包括中文),Google 會(huì)持續(xù)更新寫代碼、識(shí)別/生成圖片以及多語(yǔ)言支持。
▲ Bard:我不會(huì)中文,但希望未來(lái)會(huì)說(shuō)
目前,Bard 僅在英國(guó)、美國(guó)開放訪問(wèn)權(quán)限,未來(lái)會(huì)逐漸擴(kuò)展到更多國(guó)家和地區(qū)。
聊天就能做圖,Bing Chat 更進(jìn)一步
Bing Chat 到底有多火,或許只有上線一個(gè)月就讓 Bing 日活首次突破 1 億的數(shù)據(jù)能說(shuō)明了。從復(fù)雜問(wèn)題到娛樂(lè)聊天,再到靈感創(chuàng)意的實(shí)現(xiàn),Bing Chat 正在重塑我們網(wǎng)絡(luò)搜索的體驗(yàn)。
從現(xiàn)在起,你可以讓 Bing Chat 畫圖了。
微軟為新 Bing 和 Edge 瀏覽器的預(yù)覽版更新了三個(gè)新功能:Bing Image Creator、人工智能驅(qū)動(dòng)的 Stories 以及 Knowledge Cards 2.0。其中最重要的當(dāng)屬可以畫畫的 Bing Image Creator。
微軟表示,人腦處理視覺(jué)信息的速度比文本快約 6 萬(wàn)倍,Bing 的搜索數(shù)據(jù)中,圖像是搜索最多的類型之一,而由 DALL·E 模型的高級(jí)版本提供支持的 Bing Image Creator,可以讓我們通用自己的語(yǔ)言在 Bing Chat 中描述圖片信息、選擇藝術(shù)風(fēng)格,Image Creator 就會(huì)聯(lián)系上下文,將你的想象「畫在紙上」。
Bing Image Creator 的加入,讓 Edge 瀏覽器變成了第一個(gè)集成人工智能圖像生成器的瀏覽器。
由人工智能驅(qū)動(dòng)的 Stories 和 Knowledge Cards 2.0,可以讓你在搜索后獲得圖像、短視頻以及由人工智能驅(qū)動(dòng)的信息圖表,可以一目了然的獲取事實(shí)和關(guān)鍵信息。
未來(lái)使用 Bing 搜索時(shí),你獲得的就不是一個(gè)個(gè)冷冰冰的網(wǎng)頁(yè)鏈接,而是更加豐富、有趣的圖片、視頻以及視覺(jué)故事。
如果你已經(jīng)通過(guò)新 Bing 申請(qǐng),現(xiàn)在就可以在 Bing Chat 中體驗(yàn) Bing Image Creator 了,如果從以下網(wǎng)址進(jìn)去的話,則可以直接試用。
https://www.bing.com/create
不過(guò)這一功能暫只支持英文,未來(lái)會(huì)持續(xù)更新。
Adobe Firefly:「友軍中的最強(qiáng)輔助」
當(dāng)科技公司卷到圖片生成后,著名設(shè)計(jì)創(chuàng)意公司 Adobe 自然不甘人后。在這個(gè)瘋狂的夜晚,Adobe 也推出了自己的創(chuàng)意生成式 AI 模型集:Adobe Firefly。
Adobe 用幾個(gè)簡(jiǎn)單的例子展示了 Firefly 的能力。你可以用一句話,讓正處于春天的風(fēng)景,變成冬天的模樣。
你也可以在草地上用筆刷隨意刷一下,然后告訴 Firefly 這是一條河,它就會(huì)自動(dòng)生成河流。
Firefly 能做的自然不只這些,框選狗狗的毛發(fā),它可以將毛發(fā)變成畫筆,現(xiàn)場(chǎng)幫狗狗改變發(fā)型;設(shè)計(jì)一個(gè)藝術(shù)字,它能幫你生成一個(gè)單詞、一句話;設(shè)計(jì)好一款耳機(jī),F(xiàn)irefly 還能把它放到場(chǎng)景中,變成產(chǎn)品展示圖……
Adobe 認(rèn)為,AI 正在提供一種打開世界的新方式,設(shè)計(jì)師可以用最順手的方式來(lái)實(shí)現(xiàn)創(chuàng)意,「幫助創(chuàng)意人而不是取代創(chuàng)意人」。
同時(shí),Adobe 還創(chuàng)立了「內(nèi)容真實(shí)性倡議」CAI,建立了可信數(shù)字內(nèi)容歸屬的全球標(biāo)準(zhǔn),并對(duì)人工智能生成的內(nèi)容進(jìn)行標(biāo)記,打造 Firefly 生態(tài)系統(tǒng),「Adobe Firefly 是友軍,更是友軍里的最強(qiáng)輔助」。
進(jìn)擊的 AIGC
這一夜里,我們見證了 AI 領(lǐng)域從服務(wù)層到應(yīng)用層的幾個(gè)大突破。
這些扎堆出現(xiàn)的更新從側(cè)面證明了,AI 領(lǐng)域邁進(jìn)了一個(gè)高速發(fā)展的階段。上一個(gè)月 AI 可能還畫不好手指,下一個(gè)月憑借算力提升和模型升級(jí),AI 已經(jīng)能取代掉服裝模特的工作。
無(wú)數(shù)的科幻作品都預(yù)言過(guò) AI 在未來(lái)會(huì)成為我們生活的一部份,但沒(méi)有人告訴過(guò)我們,我們離這個(gè)未來(lái)只有咫尺之遙。
我們的生活正在被 AI 一點(diǎn)點(diǎn)地改寫。在 GTC 大會(huì)上,黃仁勛提出了一個(gè)很有意思的觀點(diǎn),他認(rèn)為生成式 AI 就是一種新型的計(jì)算機(jī),我們可以用人類語(yǔ)言進(jìn)行編程,任何人都可以命令計(jì)算機(jī)來(lái)解決問(wèn)題。
過(guò)去的幾個(gè)月里,我們見證了 AI 是如何逐步掌握畫畫、寫作、剪輯、制表、做 PPT 等技能,按照這個(gè)進(jìn)化速度發(fā)展下去,還有什么是 AI 不能做的嗎?
OpenAI 的 CEO Sam Altman 最近在 Twitter 上大膽預(yù)測(cè)了新版「摩爾定律」,他認(rèn)為全球人工智能運(yùn)算量每隔 18 個(gè)月就會(huì)翻一番。
也就是說(shuō),如果你對(duì)生成式 AI 還留有質(zhì)疑,那么時(shí)間會(huì)給你最有力的答案。
關(guān)鍵詞: