人工智能“技術(shù)奇點(diǎn)”越來(lái)越近了。
近日,聊天機(jī)器人模型ChatGPT風(fēng)靡全網(wǎng)。憑借背后強(qiáng)大的技術(shù),ChatGPT可以完成流暢對(duì)答、寫劇本、寫代碼等各項(xiàng)功能,目前全球已經(jīng)積累超過(guò)百萬(wàn)的用戶。它甚至可以創(chuàng)作詩(shī)歌和笑話,這是一種之前被認(rèn)為只屬于人類的能力。
OpenAI的聯(lián)合創(chuàng)始人馬斯克評(píng)價(jià)道,“好得可怕,我們離強(qiáng)大到危險(xiǎn)的AI不遠(yuǎn)了?!?/p>
這并不是AIGC(AI generated content,AI技術(shù)生成內(nèi)容)第一次震驚人類。時(shí)間推回到八個(gè)月以前,主業(yè)從事PPT設(shè)計(jì)的博主阿文偶然刷到一位藝術(shù)家的微博,內(nèi)容包括幾張十分驚艷的圖片,“一開始我還以為是他自己畫的,結(jié)果他說(shuō)那是直接通過(guò)文字生成的,在那時(shí)的我看來(lái)這是一件不可思議的事情。”
被深深震撼的阿文投身關(guān)注起AI繪畫這個(gè)領(lǐng)域,并在微博上做起了相關(guān)技術(shù)的推廣者。短短幾個(gè)月,阿文深刻感受到技術(shù)的飛速精進(jìn)與完善,“4月份的時(shí)候生成的圖片還是比較偏意識(shí)流的,五六月份的時(shí)候已經(jīng)畫得越來(lái)越像人,尤其是現(xiàn)在已經(jīng)非??植懒恕!?/p>
OpenAI創(chuàng)始人兼CEO Sam Altman曾表示:“十年前的傳統(tǒng)觀點(diǎn)認(rèn)為,人工智能首先會(huì)影響體力勞動(dòng),然后是認(rèn)知?jiǎng)趧?dòng),再然后,也許有一天可以做創(chuàng)造性工作?,F(xiàn)在看起來(lái),它會(huì)以相反的順序進(jìn)行?!?/p>
由此也掀起一場(chǎng)關(guān)于AI替代人類的討論,插畫師、媒體工作者等從事內(nèi)容生產(chǎn)的群體感受到了危機(jī),抵制AIGC的聲音此起彼伏。只是歷史的車輪滾滾向前,技術(shù)的發(fā)展并不會(huì)因?yàn)槿祟惖膽岩啥兴A簟?/p>
“這項(xiàng)技術(shù)出來(lái)了,你就不可能再把它塞回去,”阿文表示,“這是一場(chǎng)離我們特別近的技術(shù)革命,我們能做的就只有調(diào)整心態(tài)迎接它?!?/p>
AIGC走向大眾
在AIGC逐步“爆發(fā)”的過(guò)程里,看似兩條路徑的ChatGPT和AI繪畫,其實(shí)始終由一根線串連。想了解整個(gè)過(guò)程,要先看回這根線的始端:ChatGPT背后的科技公司,OpenAI。
背靠微軟的全球頂級(jí)AI實(shí)驗(yàn)室OpenAI提出了強(qiáng)大的預(yù)訓(xùn)練語(yǔ)言模型:GPT(Generative Pre-trained Transformer)系列,這一系列的模型可以在非常復(fù)雜的NLP任務(wù)中完成諸如生成文字、生成代碼、回答問(wèn)題等。有趣的是,2018年,當(dāng)?shù)谝淮鶪PT剛剛面世時(shí),一心專注于強(qiáng)化學(xué)習(xí)的OpenAI還只是用它來(lái)做語(yǔ)言理解方面任務(wù),未曾想到,GPT的生成潛力才將是帶領(lǐng)該公司走向聞名的技術(shù)道路。
這并沒(méi)有持續(xù)很久,在GTP-2出世之時(shí),OpenAI顯然已經(jīng)發(fā)現(xiàn)了GTP真正的強(qiáng)項(xiàng)。得益于更高的數(shù)據(jù)質(zhì)量和更大的數(shù)據(jù)規(guī)模,彼時(shí)GTP-2生成的故事在流暢度和邏輯性上已經(jīng)有了驚人的效果。
更大的轉(zhuǎn)變?cè)?020年,也就是GTP-3的現(xiàn)身。1750億參數(shù)的GPT-3曾一度是AI歷史上最大的機(jī)器學(xué)習(xí)模型,預(yù)訓(xùn)練的數(shù)據(jù)量是GTP-2的十倍不止。至此,OpenAI對(duì)GPT-3的期望已經(jīng)放在了實(shí)用性和通用性上,商業(yè)化路徑逐漸顯露,釋放出API接口供公眾調(diào)用,不到一年就吸引了約300家公司。
隨后的一年里,OpenAI進(jìn)行了多次多模態(tài)的探索,比較知名的是文字生成圖片的模型DALLE和DALLE2,可以將它們理解為是GPT-3的圖像版本。尤其是2022年推出的新版DALLE2,其使用的擴(kuò)散模型將圖片的生成提升到了一個(gè)新的高度,對(duì)文字的理解更加精確、繪畫水平更高、渲染更快,已經(jīng)可以生成完整的人像和圖片,AI繪畫的能力開始被更多人關(guān)注。
今年8月,借鑒DALLE2的思路,StabilityAI的Stable Diffusion模型橫空出世,該模型是最新的擴(kuò)散模型,能夠在消費(fèi)級(jí)顯卡上實(shí)現(xiàn)DALLE2級(jí)別的圖像生成,生成效率卻提高了30倍。目前在該模型下,AI生成的圖片已經(jīng)具有極高的藝術(shù)性,甚至可以與專業(yè)畫師媲美。此外,與DALLE2不同的是,Stable Diffusion完全免費(fèi)開源,所有代碼均在GitHub上公開,任何人都可以拷貝使用,這為AI繪畫帶來(lái)新的生機(jī)。
目前,Stable Diffusion的各渠道累計(jì)日活用戶超千萬(wàn),已經(jīng)吸引超過(guò)20萬(wàn)開發(fā)者。其背后的公司Stability AI作為初創(chuàng)公司,于10月宣布獲得了1.01億美元超額融資,估值已達(dá)10億美元,成為新晉獨(dú)角獸。而在這波AIGC的浪潮里,開頭提到的領(lǐng)頭企業(yè)OpenAI,如今估值更是已經(jīng)超過(guò)了200億美元。
商業(yè)化初嘗試
在紅杉資本一篇名為《生成式AI:一個(gè)充滿創(chuàng)造力的新世界》(Generative AI: A Creative New World)的文章中,紅杉表示,生成式AI,讓機(jī)器開始大規(guī)模涉足知識(shí)類和創(chuàng)造性工作,這涉及數(shù)十億人的工作,未來(lái)預(yù)計(jì)能夠產(chǎn)生數(shù)萬(wàn)億美元的經(jīng)濟(jì)價(jià)值。
這點(diǎn)出了AIGC的商業(yè)化前景,一時(shí)間賽道火熱,國(guó)內(nèi)外龍頭紛紛下場(chǎng)。
今年9月底,Meta發(fā)布了一個(gè)新的人工智能系統(tǒng)Make-A-Video,可以基于文本提示生成短視頻。緊接著,Google也發(fā)布兩款文本轉(zhuǎn)視頻工具,分別是強(qiáng)調(diào)視頻品質(zhì)的Imagen Video,以及主打視頻長(zhǎng)度的Phenaki。這較此前提到的文本生成圖像來(lái)說(shuō)又是新一輪的技術(shù)升級(jí)。
國(guó)內(nèi)大廠中,百度、阿里、商湯、美圖等企業(yè)都有AIGC的相關(guān)布局,百度創(chuàng)始人兼首席執(zhí)行官李彥宏在出席2022聯(lián)想創(chuàng)新科技大會(huì)時(shí)表示,過(guò)去一年無(wú)論是在技術(shù)層面還是商業(yè)應(yīng)用層面,人工智能都有了巨大的進(jìn)展,有些甚至是方向性的改變。
西湖心辰COO俞佳在接受21世紀(jì)經(jīng)濟(jì)報(bào)道記者采訪時(shí)表示,已明顯感受到AI生成文字和AI生成圖像發(fā)展到了商業(yè)可用的階段。去年年底,西湖心辰上線了Firday平臺(tái),聚焦AI寫作;今年8月,AI繪畫平臺(tái)盜夢(mèng)師上線,創(chuàng)造出日增5萬(wàn)用戶的增長(zhǎng)速度。
從應(yīng)用角度來(lái)看,如今的AIGC作為工具來(lái)說(shuō)無(wú)疑已經(jīng)是成熟的。
以文字生成為例,據(jù)俞佳介紹,西湖心辰的Firday平臺(tái)可以生成短視頻腳本、口播、營(yíng)銷文本,甚至雅思作文等,基本與國(guó)際上普遍的文字生成功能大同小異。
而這樣的商業(yè)模式已經(jīng)被證明是可行的。海外初創(chuàng)公司Jasper提供生成Instagram標(biāo)題,編寫TikTok視頻腳本、廣告營(yíng)銷文本等內(nèi)容,截至2021年,已擁有超過(guò)70000位客戶,包括Airbnb、IBM等知名企業(yè),并創(chuàng)造了4000萬(wàn)美元的收入。在最新一輪的融資里,Jasper獲得了1.25億美元資金,目前估值已達(dá)15億美元。
文字生成圖片的應(yīng)用雖仍主要是C端玩家的娛樂(lè)消遣,但已有專業(yè)用戶逐步入坑。據(jù)百度AI繪畫平臺(tái)文心一格的相關(guān)負(fù)責(zé)人介紹,以文心一格為例,在輔助創(chuàng)作方面,該平臺(tái)可以啟發(fā)畫師、設(shè)計(jì)師、藝術(shù)家等專業(yè)視覺(jué)內(nèi)容創(chuàng)作者的靈感,提供創(chuàng)意思路,輔助進(jìn)行藝術(shù)創(chuàng)作;在提升效率層面,可以為媒體、作者等文字內(nèi)容創(chuàng)作者提供高質(zhì)量、高效率的配圖,提升創(chuàng)作效率。
近期,OpenAI已經(jīng)與全球最大的版權(quán)圖片供應(yīng)商之一的Shutterstock達(dá)成深度合作,Shutterstock將AI繪畫引入商業(yè)圖庫(kù)。有分析人士認(rèn)為,隨著AUGC的成熟和完善,AI繪畫必將代替類似的圖片素材。
“AIGC還處于非常早期,目前文字生成已經(jīng)與行業(yè)結(jié)合得比較好了,圖片生成也會(huì)是一樣的,”俞佳表示,“畢竟行業(yè)本身的需求一直是存在的,只是之前還沒(méi)有被滿足而已?!?/p>
頭豹研究院高級(jí)分析師朱曉雯告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者:“從目前來(lái)看,在部分細(xì)分場(chǎng)景,例如繪畫、翻譯等內(nèi)容生產(chǎn)領(lǐng)域,可能會(huì)有很快的落地化普及,但要實(shí)現(xiàn)大規(guī)模的商業(yè)化落地,保守估計(jì)需要3~5年的時(shí)間積累才有可能?!?/p>
國(guó)盛證券認(rèn)為,AIGC將是Web 3.0時(shí)代的生產(chǎn)力工具。當(dāng)我們邁入Web 3.0時(shí)代,人工智能、關(guān)聯(lián)數(shù)據(jù)和語(yǔ)義網(wǎng)絡(luò)構(gòu)建,形成人與網(wǎng)絡(luò)的全新鏈接,內(nèi)容消費(fèi)需求飛速增長(zhǎng),UGC、PGC這樣的內(nèi)容生成方式將難以匹配擴(kuò)張的需求。由此,將來(lái)文字生成、圖片繪制、視頻剪輯、游戲內(nèi)容生成皆可由AI替代。
抵制還是擁抱?
AIGC在短時(shí)間內(nèi)帶來(lái)的沖擊有些大,正如阿文所說(shuō),我們正在經(jīng)歷一場(chǎng)技術(shù)變革。只是這場(chǎng)變革既然來(lái)得突然,就必然會(huì)帶著眾多問(wèn)題和懷疑,就像所有新技術(shù)初來(lái)乍到時(shí)一樣。
朱曉雯表示,當(dāng)前,AIGC賽道尚處于孕育探索階段,相關(guān)法律法規(guī)、技術(shù)倫理等問(wèn)題仍亟待解決,短期內(nèi)還難以實(shí)現(xiàn)大規(guī)模商業(yè)化應(yīng)用。
版權(quán)是當(dāng)下比較敏感的話題之一,也是很多人抵制AIGC的原因之一,在AI繪畫領(lǐng)域尤為嚴(yán)重。一些原畫師抨擊AI繪畫是未經(jīng)授權(quán)作品的拆解和再拼湊,這也導(dǎo)致了接受AI技術(shù)的畫師因擔(dān)心侵權(quán),在日常工作中不敢商用該技術(shù)。
出現(xiàn)這個(gè)問(wèn)題的原因與用來(lái)訓(xùn)練AI的數(shù)據(jù)源有關(guān),里面很多內(nèi)容沒(méi)有經(jīng)過(guò)授權(quán),而AI生成的成品中出現(xiàn)了與原畫相似的痕跡。“但如果想都經(jīng)過(guò)授權(quán)幾乎是不可能的,比如一些非常好的模型,用的圖可能有20億張,不可能把所有的圖都去跟圖源作者確權(quán)。”阿文表示。
對(duì)于此,俞佳向記者解釋稱,AI作畫的邏輯并不是搬運(yùn)和抄襲,而是通過(guò)學(xué)習(xí)了解了“畫畫”是一個(gè)怎樣的概念,“如果一個(gè)小朋友從小就只看梵高的畫,之后你讓他自己創(chuàng)作,他很有可能畫出來(lái)就和梵高的風(fēng)格很像?!?/p>
浙江漢鼎律師事務(wù)所張永輝律師在接受21世紀(jì)經(jīng)濟(jì)報(bào)道記者采訪時(shí)表示,著作權(quán)法中針對(duì)作品的獨(dú)創(chuàng)性具有明確規(guī)定,作品必須具備獨(dú)創(chuàng)性和可復(fù)制性。
“AIGC的繪畫風(fēng)格與繪畫內(nèi)容都是由用戶通過(guò)網(wǎng)絡(luò)技術(shù)設(shè)計(jì)而成,與普通畫作一樣,可以體現(xiàn)一定的智力水平和作者的創(chuàng)作表達(dá),其生成內(nèi)容具有思想表現(xiàn)形式的作品外觀,應(yīng)當(dāng)獲得著作權(quán)法的保護(hù)。”張永輝律師表示,“如果AIGC軟件只是簡(jiǎn)單地復(fù)制粘貼原畫作,或者照搬原作品成為自己的作品一部分,那就需要獲得原作者的同意并支付使用費(fèi)?!?/p>
創(chuàng)作者們對(duì)于版權(quán)問(wèn)題的敏感程度體現(xiàn)了他們對(duì)于自創(chuàng)內(nèi)容的珍視,而AIGC如今所能做到的幾乎已經(jīng)達(dá)到了創(chuàng)作者的平均水平,人類創(chuàng)作的價(jià)值突然被降低,這也是一些人抵制新技術(shù)的另一層原因,由此引出了那個(gè)老生常談話題:AI會(huì)取代人類嗎?
回答此問(wèn)題或許可以從一段歷史中窺見結(jié)果。
19世紀(jì)時(shí),法國(guó)詩(shī)人Charles Pierre Baudelaire曾稱攝影為“藝術(shù)最致命的敵人”,原本以寫實(shí)為目標(biāo)的繪畫作品在照相機(jī)問(wèn)世后變得失去了意義和光彩,人們對(duì)真實(shí)的定義出現(xiàn)新的變化。但這卻促使了畫家們思考如何化危為機(jī),并積極探索出繪畫藝術(shù)的新形式。19世紀(jì)六七十年代,以莫奈馬奈為代表的印象主義畫派產(chǎn)生,打破了寫實(shí)油畫長(zhǎng)期一統(tǒng)天下的局面,藝術(shù)又迎來(lái)了新的春天。
這與AIGC的發(fā)展是類似的。AI并不會(huì)扼殺人所有的意義,而是會(huì)開辟更多可能性?!叭伺cAI一定會(huì)是一個(gè)協(xié)同的形式,”俞佳認(rèn)為,“人并不會(huì)丟了飯碗,但他的角色會(huì)產(chǎn)生變化?!?/p>
李彥宏曾公開表示,AIGC需走過(guò)“助手階段”“協(xié)作階段”和“原創(chuàng)階段”三大階段。俞佳認(rèn)為,如果按照這個(gè)來(lái)分,目前的AIGC已經(jīng)處于“協(xié)作階段”,即除單純輔助外,AI還在一定程度上扮演引領(lǐng)者的角色,為人類提供靈感和思路。
朱曉雯認(rèn)為,一方面,AIGC還需針對(duì)需求離散化和時(shí)間精力的有限等痛點(diǎn)展開,進(jìn)一步拓展深度學(xué)習(xí)等;另一方面需要對(duì)制作內(nèi)容進(jìn)行一定的管控,需要有完善的法律法規(guī),確保其發(fā)展為一項(xiàng)有效、合規(guī)的高科技產(chǎn)業(yè)。
阿文的態(tài)度則更為開放,他認(rèn)為知道風(fēng)向在哪里,及時(shí)調(diào)整自己就可以?!鞍袮I納入到自己工作流程,我覺(jué)得是一個(gè)遲早的問(wèn)題。既然躲不掉的話,還不如早一點(diǎn)擁抱它。”