開年大模型再出“王炸” 短視頻行業(yè)將被AI顛覆嗎?
本報(bào)記者 趙語(yǔ)涵 袁璐
相似的時(shí)間點(diǎn),更甚于上次的震撼。2月16日,曾以大模型ChatGPT震驚全球的人工智能科技公司OpenAI再次祭出新“王炸”——文生視頻大模型Sora,只需輸入一段文本指令,即可生成一段60秒的視頻,畫面精致細(xì)膩。
“AI(人工智能)成長(zhǎng)速度比想象中更快!”有人對(duì)此振奮,也有人表達(dá)擔(dān)憂:“人類是否真的準(zhǔn)備好了?”但越來(lái)越多的聲音認(rèn)為,人工智能將引領(lǐng)第四次工業(yè)革命。
首個(gè)視頻大模型橫空出世
Sora并非首個(gè)文生視頻大模型。此前,科技巨頭谷歌、創(chuàng)業(yè)公司Runway等都已布局這一賽道。Sora何以驚艷全球?相比此前應(yīng)用,它將生成視頻的時(shí)間大幅延長(zhǎng)至60秒,在畫面的細(xì)致逼真、流暢程度、三維空間多角度呈現(xiàn)等方面也有明顯提升。
360集團(tuán)創(chuàng)始人周鴻祎就談到了幾個(gè)讓他印象深刻的鏡頭:小狗在雪地玩耍濺起紛飛的雪粒,毛茸茸的毛發(fā)根根分明、隨風(fēng)浮動(dòng);咖啡杯里,兩只帆船“纏斗”掀起翻涌的波浪水紋;不同角度的街景通過(guò)運(yùn)鏡流暢地呈現(xiàn)。
跳出視頻領(lǐng)域,更深廣的變革或許正悄然發(fā)生。
周鴻祎談到,Sora的顛覆性絕不僅僅限于一個(gè)文字生成視頻的工具,而是通用人工智能對(duì)世界理解的又一次突破。一年前,ChatGPT標(biāo)志著人工智能對(duì)人類語(yǔ)言和知識(shí)的理解達(dá)到了一個(gè)突破點(diǎn)。而除此之外,這個(gè)世界還有很多規(guī)律,例如小狗拱雪雪會(huì)留在鼻子上、無(wú)人機(jī)在空中飛時(shí)視角如何變換等,而Sora目前生成的視頻,顯示它對(duì)這個(gè)世界的規(guī)律有了更為完整的理解。這意味著,通用人工智能時(shí)代或?qū)⒓铀俚絹?lái)。
同濟(jì)大學(xué)人文學(xué)院特聘教授解學(xué)芳也認(rèn)為,Sora的出現(xiàn)意味著AI理解真實(shí)世界的能力進(jìn)一步躍升,但這類大模型的突破性發(fā)展未來(lái)也會(huì)受到算力、算法、倫理法規(guī)的制約,應(yīng)對(duì)其保持積極且審慎的態(tài)度。
視頻行業(yè)格局或被重塑
Sora的橫空出世,讓視頻領(lǐng)域從業(yè)者感受到了危機(jī)?!疤鸷常杏X要丟飯碗了?!北本┠澄幕瘋鞑ビ邢薰緞?chuàng)始人胡娟坦言,Sora讓她危機(jī)感陡增,“這完全可以用于鏡頭樣板,一些復(fù)雜的特效制作,以前工期至少得好幾天,但AI將其縮短到了幾分鐘?!?/p>
攝影師李浩楠認(rèn)為,Sora對(duì)影視相關(guān)的產(chǎn)業(yè)影響比較大,能大幅拉低制作成本,特別是涉及多角度、多機(jī)位的視頻,如果AI能夠部分替代人工拍攝和剪輯,成本可能只要原來(lái)的十分之一。
Sora的技術(shù)突破也讓大大小小生成式AI創(chuàng)業(yè)公司和投資機(jī)構(gòu)的前景變得充滿挑戰(zhàn)。某專注全球早中期企業(yè)的風(fēng)投公司運(yùn)營(yíng)合伙人羅超表示,Sora表現(xiàn)出的領(lǐng)先性讓Runway、Pika Labs等視頻生成大模型明星公司面臨強(qiáng)力沖擊,而相比這些自研大模型公司,純做應(yīng)用的創(chuàng)業(yè)公司則更加前途未卜。
在新壹科技CEO雷濤看來(lái),Sora的誕生,無(wú)疑會(huì)改變AI視頻生成市場(chǎng)格局。“就國(guó)內(nèi)而言,要看哪些企業(yè)能結(jié)合、利用新技術(shù),完善符合國(guó)情的產(chǎn)品?!?/p>
AI讓“眼見不一定為實(shí)”
Sora展示的生成視頻也被發(fā)現(xiàn)有不少“穿幫”鏡頭。比如,在一段老奶奶吹蠟燭的視頻中,老奶奶吹氣后蠟燭卻沒有熄滅;在另一段玻璃杯從空中墜落的視頻中,玻璃杯剛被抬到半空,桌上就已經(jīng)有水流出來(lái)了。
這也是目前文生視頻大模型的短板——不懂物理世界以及因果關(guān)系等。在中國(guó)政法大學(xué)傳播法研究中心副主任朱巍看來(lái),大模型所生成的視頻代表著AI對(duì)這個(gè)世界規(guī)律的理解,但這不一定都是正確的,因此也讓“眼見不一定為實(shí)”。
更廣泛的擔(dān)憂,是視頻的可信度高于文字和圖片,一旦生成門檻被大幅降低,難辨真?zhèn)蔚奶摷僖曨l可能會(huì)被用于傳播謠言、詐騙等非法領(lǐng)域。對(duì)此,朱巍認(rèn)為,應(yīng)參考此前針對(duì)生成式AI的相關(guān)規(guī)定,對(duì)AI生成內(nèi)容予以標(biāo)識(shí)。
此外,創(chuàng)作者用一段文字生成視頻后,該視頻的版權(quán)歸屬等問題也需要重新梳理。目前,針對(duì)AI生成文字或圖片的著作權(quán)歸屬問題已形成爭(zhēng)論。去年年底,北京互聯(lián)網(wǎng)法院就針對(duì)一起“人工智能生成圖”著作權(quán)侵權(quán)糾紛案做出一審判決,這也是我國(guó)首例涉及“AI文生圖”著作權(quán)案件。法官認(rèn)為,人們利用生成式人工智能生成圖片時(shí),本質(zhì)上仍然是人利用工具進(jìn)行創(chuàng)作,如果能體現(xiàn)出人的獨(dú)創(chuàng)性智力投入,就應(yīng)當(dāng)被認(rèn)定為作品,受到著作權(quán)法的保護(hù)。(北京日?qǐng)?bào))
版權(quán)聲明:凡注明“來(lái)源:中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來(lái)源中國(guó)西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- 2023首都科普年度榜單發(fā)布
- 自由式滑雪雪上技巧比賽收官
- “數(shù)字十四冬 智慧全運(yùn)會(huì)”簡(jiǎn)約不簡(jiǎn)單
- 熱情!震撼!文化氛圍濃
- 內(nèi)蒙古電影市場(chǎng)喜迎“龍?zhí)ь^”
- 春節(jié)假期全區(qū)交通運(yùn)行平穩(wěn)有序
- 今年內(nèi)蒙古首個(gè)特高壓配套電網(wǎng)工程投運(yùn)
- 2023年內(nèi)蒙古鋪就5106公里鄉(xiāng)村“幸福路”
- 內(nèi)蒙古:民生水利建設(shè)“加速跑” 32萬(wàn)農(nóng)牧民受益
- 內(nèi)蒙古開展四項(xiàng)行動(dòng)保障困難群眾溫暖過(guò)節(jié)