在剛剛過去的一個月,來自中國的一款視頻生成大模型可靈成為全球范圍內(nèi)最受關注的AI產(chǎn)品。創(chuàng)刊于1899年的美國權威技術雜志《麻省理工科技評論》在其官方網(wǎng)站刊文指出,來自中國的新型“文生視頻”人工智能模型“令人興奮”,由中國互聯(lián)網(wǎng)企業(yè)快手發(fā)布的這款產(chǎn)品,在行業(yè)里具有里程碑的意義——這是全球范圍內(nèi)首款可供公眾測試的文生視頻大模型產(chǎn)品。
過去兩年多來,從ChatGPT發(fā)布到視頻生成大模型Sora問世,都引發(fā)了科技界、產(chǎn)業(yè)界的廣泛關注。Sora的出現(xiàn)不僅推動了AIGC技術在全球范圍的邁進,也引發(fā)了對于中國在未來的全球AI競爭中,是否還有技術創(chuàng)新能力的關注。
“可靈”大模型的發(fā)布不僅在國際大模型技術圈層展現(xiàn)了中國技術具備領先可能,也在一定程度上加速了AI生成視頻產(chǎn)品的競爭。如何看待人工智能對于新質生產(chǎn)力的正向作用?下一步如何推動應用場景和商業(yè)化的應用?圍繞這一主題,瞭望智庫近期在京召開了“未來已來,擁抱人工智能+新質生產(chǎn)力”課題研討會,國產(chǎn)視頻生成大模型,正在成為助力創(chuàng)作者和行業(yè)從業(yè)者提效的技術實現(xiàn)路徑。
國產(chǎn)視頻生成大模型海外爆紅
從ChatGPT發(fā)布到視頻生成大模型Sora問世,來自美國的人工智能公司OpenAI牢牢占據(jù)AIGC領域的創(chuàng)新高峰。所有后來者,不可避免地要接受來自科技愛好者、專業(yè)從業(yè)者以及行業(yè)的高標準比較,甚至更多時候需要先突破大眾“先入為主”的質疑。
國產(chǎn)大模型可靈(Kling)發(fā)布后,美國著名創(chuàng)業(yè)投資公司Y Combinator CEO 于6月8日在海外社交媒體平臺轉發(fā)并稱贊了可靈生成的 Demo(樣片);英國開源人工智能公司Stability AI 前 CEO Emad Mostaque 表示:“中國的 AI 技術有自己的優(yōu)勢。”可靈在大幅度運動的合理性、物理世界特性的高度模擬能力,以及強大的概念組合能力和想象力方面都獲得了海外專業(yè)人士的認可。
美國科技媒體在對可靈的評價中,也罕見地釋放了同一信號:這是中國大型科技公司在人工智能 (AI) 應用領域努力趕上美國同行的最新跡象。比如,硅谷的科技新聞媒體The Information將可靈評價為“讓人印象深刻的”,并稱之為Sora的競爭對手。另一家美國科技媒體Tech Radar同樣表示,視頻生成是下一個 AI 大戰(zhàn)場,Kling AI 是一個令人印象深刻的新對手。
在媒體的報道中,可靈最初被稱之為國產(chǎn)版Sora,但來自海內(nèi)外眾多的產(chǎn)品測評顯示,國產(chǎn)版Sora的定義明顯低估了可靈的能力。一家專注于人工智能研究的自媒體“The AI GRID”甚至在測評后,直接給出了“Game Over”的結論,表示中國最新的AI視頻工具可靈已經(jīng)全面戰(zhàn)勝了Sora。
可靈的出現(xiàn),也在一定程度上加速了AI視頻領域的競爭。就在快手可靈上線一周后的6月13日,Luma AI發(fā)布最新文生視頻模型Dream Machine,向所有用戶免費開放使用,生成式AI平臺Runway7月2日宣布,其文生視頻模型Gen-3 Alpha向所有用戶開放使用。
業(yè)內(nèi)人士認為,AI大模型與全球生成式AI的行業(yè)生態(tài)和產(chǎn)業(yè)格局息息相關,這也是可靈“一石激起千層浪”的核心原因。
人工智能發(fā)展如何走出“中國路徑”
搶灘AI至高點過程中,對中國AI能力的一個普遍判斷是,雖處于第一梯隊,但與Open AI等所代表的發(fā)達國家人工智能研發(fā)相比,還處于追趕狀態(tài)。以可靈為代表的國產(chǎn)視頻生成大模型,正在修正這一觀點,并給中國人工智能創(chuàng)新領域注入信心。
“應充分認識我國發(fā)展人工智能的優(yōu)勢。”十三屆全國政協(xié)社會和法制委員會副主任陳智敏表示,我國發(fā)展人工智能的優(yōu)勢有:黨的集中統(tǒng)一領導,新型舉國體制,集中力量辦大事的優(yōu)勢;制造業(yè)的優(yōu)勢,我國制造業(yè)總產(chǎn)值占全球比重達35%,為人工智能基礎設施建設奠定了堅實的基礎;民營企業(yè)敢闖敢試優(yōu)勢,我國民營企業(yè)貢獻50%以上的稅收,60%以上的GDP,70%以上的技術創(chuàng)新成果。
一個來自行業(yè)的共識是,以可靈為代表的視頻生成大模型,早已突破“豐富創(chuàng)意庫工具”層面的較量,轉向了“新質生產(chǎn)力工具”的革新。
“6月份第一周,可靈是世界第一。”長期關注人工智能應用的清華大學新聞學院教授沈陽表示,在人工智能應用上,要重視短視頻領域和人工智能的結合。
“短視頻占到中國網(wǎng)民上網(wǎng)的一半時間,全世界現(xiàn)在慢慢也是這樣。”沈陽表示,目前大模型領域從應用的角度來看,我們達到過世界第一,如果繼續(xù)強化,還有可能在Sora、Luma、Runway的競爭下又走出一條路。
在快手研究院執(zhí)行院長蔡雄山看來,進一步做大做強國產(chǎn)文生視頻大模型,可以充分發(fā)揮短視頻直播行業(yè)的優(yōu)勢。
“短視頻直播生態(tài)具有應用場景多元、機制靈活、反應速度快等特點,天然適合大模型訓練和應用場景布局。”蔡雄山說,可靈在海外引發(fā)的關注和業(yè)態(tài)競爭加速,對于中國人工智能發(fā)展路徑的啟發(fā)是,通往人工智能未來的競爭中,算力的確是核心因素之一,但研發(fā)所依賴的海量數(shù)據(jù)、產(chǎn)業(yè)積累、用戶規(guī)模,也是重要變量,并導向不同的發(fā)展路徑。
多位與會專家認為,無論從戰(zhàn)略布局還是產(chǎn)業(yè)參與看,全球新一輪科技競爭中,人工智能將走出“中國路徑”, 即與產(chǎn)業(yè)的更緊密融合,甚至直接脫胎于產(chǎn)業(yè)領域,實現(xiàn)新質生產(chǎn)力引領下的高質量發(fā)展。
在這一點上,視頻生成大模型可靈的率先內(nèi)測和應用,恰恰切中了這個命題。可以說,中國AI能力正在形成基礎設施、技術研發(fā)、產(chǎn)業(yè)應用、用戶驅動的多向奔赴,而不是純技術與算力的“內(nèi)卷”,這些都是中國在全球AI競爭中的優(yōu)勢,也是一家民營企業(yè)能夠推出第一個視頻大模型產(chǎn)品的獨特土壤。
作為新興數(shù)字技術,人工智能體現(xiàn)出了更高的自主性與擬真性,讓AI視頻生成技術具有廣闊的應用前景。
推動公共數(shù)據(jù)開放共享提升AI競爭力
通往人工智能未來的競爭中,算法、算力與數(shù)據(jù),是支撐大模型發(fā)展的三大基石。更高質量、更豐富的數(shù)據(jù)是生成式AI大模型成功的驅動力。
蔡雄山認為,人工智能研發(fā)與應用對資金、算力、數(shù)據(jù)的需求有目共睹,尤其在突破前沿技術方面,既需要持續(xù)的現(xiàn)金流和利潤支撐,又需要龐大的用戶基數(shù)、數(shù)據(jù)沉淀和多元的應用場景。
十三屆全國政協(xié)社會和法制委員會副主任陳智敏在研討會上表示,超大的市場、海量的數(shù)據(jù)要素、以及豐富的應用場景,是我國人工智能發(fā)展的優(yōu)勢所在。
據(jù)了解,中國的公共數(shù)據(jù)非常豐富,在可公開獲取的公共數(shù)據(jù)領域具有突出優(yōu)勢。有研究顯示,我國政府部門掌握的數(shù)據(jù)資源占據(jù)全社會數(shù)據(jù)資源總量的50%—80%左右,但目前公共數(shù)據(jù)開放共享不夠、數(shù)據(jù)利用率不高。我國公共數(shù)據(jù)開放共享還有很大空間。
針對“人工智能+新質生產(chǎn)力”的議題,新質生產(chǎn)力從全新視角釋放的新動能和新活力,對生產(chǎn)力各要素提出新要求,與會專家也提出了相關建議。
“實現(xiàn)數(shù)實融合,我認為這是催生新質生產(chǎn)力的有效途徑,同時它也可以促進生產(chǎn)關系的完善、改進。”國務院發(fā)展研究中心原副主任侯云春認為,首先要加強數(shù)與實的聯(lián)手互動;第二,精選慎選數(shù)實融合的解決方案;第三,打通盤活數(shù)據(jù)要素;第四,對于數(shù)實融合的失誤和過程要提高容忍度,允許試錯。
- 最新專題資訊 頻道推薦
-
福建省安監(jiān)局組織收聽全國安全生產(chǎn)電視電話會2024-07-03
- 進入圖片頻道最新圖文
- 進入視頻頻道最新視頻
- 一周熱點新聞