2025年10月2日 星期四

Sora 2 與 Sora 應用:將個人化「Cameo」與影音生成帶入社交新媒介

此訪談介紹了 Sora 團隊推出的 Sora 應用與其新一代模型 Sora 2,重點在於把先進的影音生成技術變成一種社交創作與溝通的新媒體。

Sora 2 能力重點

  • 同步產生影片與音訊(多語言對話、音效、聲景),為首個同時處理視訊與聲音的 Sora 模型。
  • 大幅提升物理互動、碰撞與動態模擬的真實感(例如高難度體操、滑水空翻、跑酷等動作)。
  • 更佳的可導引性(steerability),能一次生成更長、更連貫、多鏡頭敘事的內容。
  • 廣泛的風格表現力,從逼真到動畫、繪畫等各種美學都能呈現。

Cameo 功能(核心特色)

  • 使用者可上傳短片(包括人、寵物或物件),Sora 2 會深度理解並將該「身影」當成可嵌入的元素,放入任意場景或提示中。
  • 上傳流程含動態語音挑戰與活體檢查(liveness)與驗證,防止冒用;上傳者需明確授權才能被他人使用。
  • 權限控制:可設定「僅我」、「我核可的人」、「互相關注」或「任何人」等使用範圍;授權內容的創作權與刪除權歸上傳者。
  • 提供偏好設定以指導模型如何呈現你的肖像(避免莫名服飾、口音等錯誤或「幻覺」),未來將提供更進階調校工具。

應用介面與社交體驗

  • 類似社群的 feed 與個人檔案、追蹤系統,但所有影片均為人類創作者透過 AI 生成(非機器人自動發布)。
  • 提供「remix」功能,使用者可快速改編他人作品(例如變風格、改主題或轉為廣告等),鼓勵趨勢協作與共創宇宙(lore)。
  • 內建簡易創作器(composer)與上方的 Cameo 托盤,方便拖放已授權的人物進行生成。
  • 團隊強調以「連結的內容」為優先,並提供可選的追蹤頁與可篩選的心情/內容類型(例如想看輕鬆、動物等)。

安全、可追溯與內容管理

  • 出口影片將帶可視化水印(Sora 動畫標示),並支援 C2PA 與內部可追溯機制,方便辨識為 AI 生成並追查來源。
  • Cameo 嚴格禁止在未授權下生成成人或暴力等不當內容;系統使用推理型模型在下層過濾有害內容。
  • 針對未成年(U8s)與沉浸式使用有額外政策:預設無限滾動,滾動冷卻與提醒機制;若偵測到不良瀏覽習慣,會引導創作而非無意義刷片。
  • 團隊承認初期可能會有過度阻擋(overblocking),會持續調整平衡自由與濫用防護。

創作者工具與生態佈局

  • Sora.com 舊有網頁服務將加入 Sora 2,並推出像 storyboard(分鏡)等更多細緻創作控制工具。
  • 即將開放 API,讓第三方編輯器或服務整合 Sora 2 能力,支援更多專業或定製化場景。

推出與使用者導入計畫

  • 初期於 iOS 上架(美國與加拿大),採邀請制上線:下載應用後會收到通知並附四組邀請碼,鼓勵使用者與朋友一同進入以建立連結式體驗。
  • Android 與更廣地域會在後續陸續推出。

團隊願景

Sora 團隊自 2023 年起研發能「理解實體世界(physical world)」的模型,視此為邁向通用 AI(AGI)的一部分。他們希望 Sora 2 能帶來生產力以外的創造性與喜悅,並成為一種新的、以個人化影像為核心的溝通媒介。

總結:Sora 2 與 Sora 應用試圖把高真實度的影音生成技術帶入社交圈,Cameo 與 remix 等功能強化「以我入場」的創作體驗,同時團隊以權限控制、追溯機制與內容治理作為安全基礎,初期以邀請制、iOS 與美加開放。



沒有留言:

張貼留言