美股

OpenAI最新AI模型：能用圖像思考連草稿都能讀懂

鉅亨網新聞中心2025-04-25 10:20

OpenAI 剛剛發佈的全新模型，不僅能看懂你的塗鴉，還能分析它，與它互動，甚至能像人類一樣「思考」它！這是否意味著，AI 距離真正理解人類世界的方式，又邁進了一大步？

2025 年 4 月 16 日，OpenAI 推出了其最新的人工智慧模型 o3，這被稱為是該公司迄今為止最先進的模型。與此同時，他們還發佈了一個規模較小的模型 o4-mini。這兩款模型都具有一項革命性的能力——「用圖像思考」。

‌

這些模型不只是能” 看到” 圖像，它們能夠將視覺信息直接整合到思考鏈中。無論是白板上的草圖、手繪的示意圖，還是質量不佳的圖表，o3 都能理解並分析它們。用戶可以上傳這些圖像，然後 AI 會對它們進行分析並展開討論，甚至能旋轉、縮放和使用其他圖像編輯工具。

OpenAI 在聲明中寫道：「我們的推理模型首次能夠獨立使用所有 ChatGPT 工具——網路瀏覽、Python 編程、圖像理解和圖像生成」，這有助於更有效解決複雜的多步驟問題，並朝著獨立行動邁出實質性的步伐。

OpenAI 表示，o3 模型特別擅長數學、編程、科學和圖像理解，而 o4-mini 則運行更快，成本更低。從 4 月 17 日開始，ChatGPT Plus、Pro 和 Team 用戶就可以使用這兩種模型了。

這是否預示著 AI 即將成為我們生活中不可或缺的全能助手？

有趣的是，OpenAI 的用戶社區長期以來一直調侃其奇怪或令人困惑的 AI 模型命名方式。CEO Sam Altman 本週也加入了這場調侃，他在 X 平台上發文說：「如果我們在今年夏天之前解決我們的模型命名問題，那麼在此之前的幾個月里，大家可以盡情取笑我們（我們確實應該被取笑）如何？」

自 2022 年底推出爆火的 ChatGPT 聊天機器人以來，OpenAI 一直在快速升級其模型，遠遠超越了文本功能，擴展到圖像、語音和影音領域。該公司正在努力在生成式 AI 領域保持領先地位，面臨著包括谷歌、Anthropic 和馬斯克的 xAI 在內的激烈競爭。

上個月，OpenAI 發佈了一項原生圖像生成功能，因其能夠生成吉卜力工作室風格的動漫圖像而在網上病毒式傳播。而在上個月的融資輪中，該公司的估值已達到驚人的 3000 億美元。

‌

OpenAI最新AI模型：能用圖像思考 連草稿都能讀懂