2024年3月18日 星期一

從文字生成影片 AI 模型 Sora

從文字生成影片 AI 模型 Sora

女郎漫步東京街頭 (Sora 生成)

2月15日,OpenAI在官網釋出最新的生成式AI模型 Sora,它能根據使用者輸入的文字描述,產生最長1分鐘的高畫質影片。

Sora 生成的影像品質很高,《紐約時報》評論道,「這看起來像是從好萊塢電影中擷取的片段。」Sora的名字取自日語中的天空「そら」一詞。Open AI 技術背後的團隊成員說,之所以選擇這個名字,是因為 Sora 將喚起無限創造潛力的點子。

根據 Open AI 官網:「文字轉視訊模型 Sora
可以根據文字指令創建現實且富有想像的場景,產生長達一分鐘的影片,同時保持視覺品質並遵守用戶的提示。」「我們正在教授人工智慧理解和模擬運動中的物理世界,目標是訓練模型來幫助人們解決需要現實世界互動的問題。本頁所有影片均由 Sora 直接生成,未經修改」。

演示影片一: 
女郎漫步東京街頭 (影片太長未能上傳)
提示:一位時尚女性走在充滿溫暖霓虹燈和動畫城市標誌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色皮包。她戴著太陽眼鏡,塗著紅色口紅。她走路自信又隨興。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去。

象群奔跑 (Sora 生成)

演示影片二: 猛獁象群在雪地上奔跑
提示:幾隻巨大的毛茸茸的猛獁象踏著白雪皚皚的草地走近,它們長長的毛茸茸的皮毛在風中輕輕飄動,遠處覆蓋著積雪的樹木和雄偉的雪山,午後的陽光下有縷縷雲彩,太陽高高地掛在空中距離產生溫暖的光芒,低相機視角令人驚嘆地捕捉到大型毛茸茸的哺乳動物,具有美麗的攝影和景深。

海浪拍打海灘懸崖 (Sora 生成)

演示影片三: 海浪拍打海灘崎嶇懸崖
提示:無人機拍攝的海浪拍打大蘇爾加雷角海灘崎嶇懸崖的景象。蔚藍的海水激起白色的波浪,夕陽的金色光芒照亮了岩石海岸。遠處有一座小島,島上有一座燈塔,懸崖邊長滿了綠色的灌木叢。從公路到海灘的陡峭落差是一項戲劇性的壯舉,懸崖邊緣伸出海面。這一景觀捕捉到了海岸的原始之美和太平洋海岸公路的崎嶇景觀。

京街頭 (Sora 生成)

演示影片四: 東
京街頭
提示:美麗、白雪皚皚的東京城熙熙攘攘。鏡頭穿過熙熙攘攘的城市街道,跟著幾個人享受美麗的雪天並在附近的攤位購物。絢麗的櫻花花瓣隨著雪花隨風飄揚。

參觀藝廊 (Sora 生成)

演示影片五: 參觀藝廊
提示:參觀藝廊,裡面有許多不同風格的美麗藝術品

珊瑚礁紙藝世界 (Sora 生成)

演示影片六: 珊瑚礁紙藝世界

提示:一個渲染華麗的珊瑚礁紙藝世界,充滿了色彩繽紛的魚類和海洋生物。

Sora 能夠產生具有多個角色、特定類型的運動以及主體和背景的準確細節的複雜場景。了解使用者在提示中提出的要求,還了解這些東西在物理世界中的存在方式。 有些科學家和人工智慧專家都認為,人工智慧已經掌握了世界物理模型,也就是說能夠模擬真實世界,理解各種物理法則,擁有和人類一樣的智慧。

OpenAI 也承認 Sora 存在弱點。它可能難以準確模擬複雜場景的物理原理,並且可能無法理解因果關係的具體實例。例如,一個人可能咬了一口餅乾,但之後餅乾可能沒有咬痕。 該模型還可能混淆提示的空間細節,例如混淆左右,並且可能難以精確描述隨著時間推移發生的事件,例如遵循特定的相機軌跡。

目前 Sora 僅提供紅隊成員(錯誤訊息、仇恨內容和偏見等領域的領域專家)試用,讓他們以對抗性方式測試該模型,以免濫用。

但這並未削弱學者與大眾的擔憂。因為深度偽造(deepfake)對選舉的影響已經有據可查,包含複製政治人物的聲音、臉型製作虛假影片以傳遞虛假訊息。它既難以追蹤,又難以辨識,具備破壞選舉的潛力。同時,其強大的威力,也讓電影製作人、演員、場景工作人員等,甚至一些新創團隊,面臨更高的失業風險,衝擊會很巨大。

沒有留言:

張貼留言