menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

美股

OpenAI推增強版Sora生圖模型 ChatGPT可直接套用 哏圖、表情包秒出

鉅亨網新聞中心 2025-03-26 11:20

cover image of news article
(圖:REUTERS/TPG)

在 DeepSeek 24 小時前發布 V3 模型 0324 版本更新之後,不干示弱的 OpenAI 隨即 26 日推出其最新增強版 Sora 生圖模型,該模型不僅可以直接在 ChatGPT 中使用,還展示其在影像生成方面的顯著進步。

據悉,新版 Sora 的能力主要集中在影像生成上,儘管有傳言稱可能會發布 GPT-5,但從以往的產品發布節奏來看,此次更新並不會是一次重磅更新。直播中展示的新版 Sora 整合了 GPT-4o 的「全模態」能力 (即可產生文字、圖像、音訊和視訊等任何類型資料的模型),使得使用者可以透過簡單的指令或上傳照片來產生所需的影像。例如,在直播現場,OpenAI 團隊透過手機拍攝了一張自拍,並請 Sora 產生動漫風格的版本,結果令人驚訝。


OpenAI 團隊甚至還現場示範讓 Sora 在圖片上添加一段文字「Feel The AGI」(感受通用人工智慧),畫了第一張新版 Sora 的表情包,不僅文字準確清晰,並且準確地理解了當代流行哏圖中的包括粗體字等必備元素,已可直接當哏圖發到各種群組了。

此外,OpenAI 還示範了新版 Sora 在文字渲染方面的改進,能夠在圖像上產生準確且流暢的文字。這項功能的提升使得 Sora 在生成漫畫卡時,能夠自然流暢地使用日文,令日本用戶感到驚訝。過去,圖像生成模型在文字生成方面常常出現錯誤,而新版 Sora 顯然克服了這個挑戰。

OpenAI 強調,新版 Sora 在生成影像時能夠保持物件屬性和關係的準確性,尤其是在處理多個物件時表現出色。儘管生成影像的時間有所延長,OpenAI 認為這是值得的權衡,因為生成的影像品質和功能都有了顯著提升。

在安全性方面,OpenAI 也採取了措施,確保新版 Sora 能夠去除照片浮水印,阻止生成不當內容,並在所有生成的圖像中添加標準的 C2PA 元數據,以標識其來源。

目前,新版 Sora 的圖像生成功能已向 Pro 和 Plus 訂閱用戶開放,OpenAI 計劃在不久的將來將其推廣至免費用戶和 API 版本。這一系列的更新無疑將為用戶提供更豐富的體驗,而 OpenAI 的這項舉措也引發了廣泛的關注與期待。

文章標籤


Empty