menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

美股

OpenAI最新AI模型:能用圖像思考 連草稿都能讀懂

鉅亨網新聞中心 2025-04-25 10:20

cover image of news article
OpenAI最新AI模型:能用圖像思考,連草稿都能讀懂(圖:Shutterstock)

OpenAI 剛剛發佈的全新模型,不僅能看懂你的塗鴉,還能分析它,與它互動,甚至能像人類一樣「 思考」 它!這是否意味著,AI 距離真正理解人類世界的方式,又邁進了一大步?

2025 年 4 月 16 日,OpenAI 推出了其最新的人工智慧模型 o3,這被稱為是該公司迄今為止最先進的模型。與此同時,他們還發佈了一個規模較小的模型 o4-mini。這兩款模型都具有一項革命性的能力——「用圖像思考」。


這些模型不只是能” 看到” 圖像,它們能夠將視覺信息直接整合到思考鏈中。無論是白板上的草圖、手繪的示意圖,還是質量不佳的圖表,o3 都能理解並分析它們。用戶可以上傳這些圖像,然後 AI 會對它們進行分析並展開討論,甚至能旋轉、縮放和使用其他圖像編輯工具。

OpenAI 在聲明中寫道:「我們的推理模型首次能夠獨立使用所有 ChatGPT 工具——網路瀏覽、Python 編程、圖像理解和圖像生成」,這有助於更有效解決複雜的多步驟問題,並朝著獨立行動邁出實質性的步伐。

OpenAI 表示,o3 模型特別擅長數學、編程、科學和圖像理解,而 o4-mini 則運行更快,成本更低。從 4 月 17 日開始,ChatGPT Plus、Pro 和 Team 用戶就可以使用這兩種模型了。

這是否預示著 AI 即將成為我們生活中不可或缺的全能助手?

有趣的是,OpenAI 的用戶社區長期以來一直調侃其奇怪或令人困惑的 AI 模型命名方式。CEO Sam Altman 本週也加入了這場調侃,他在 X 平台上發文說:「如果我們在今年夏天之前解決我們的模型命名問題,那麼在此之前的幾個月里,大家可以盡情取笑我們(我們確實應該被取笑)如何?」

自 2022 年底推出爆火的 ChatGPT 聊天機器人以來,OpenAI 一直在快速升級其模型,遠遠超越了文本功能,擴展到圖像、語音和影音領域。該公司正在努力在生成式 AI 領域保持領先地位,面臨著包括谷歌、Anthropic 和馬斯克的 xAI 在內的激烈競爭。

上個月,OpenAI 發佈了一項原生圖像生成功能,因其能夠生成吉卜力工作室風格的動漫圖像而在網上病毒式傳播。而在上個月的融資輪中,該公司的估值已達到驚人的 3000 億美元。

文章標籤


Empty