menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon


科技

谷歌黑科技:能把照片變立體

鉅亨網新聞中心


新浪科技訊 北京時間7月10日下午消息,據美國科技博客Gizmodo報導,本周《麻省理工科技評論》(Technology Review)雜誌發布的一篇論文披露了谷歌研發的新系統DeepStereo,該系統可以通過人工智能技術將一系列照片無縫組合成為視頻。

論文作者名為約翰-弗林(John Flynn),是一名谷歌工程師,其他三位合著者也都在谷歌工作。在論文中,弗林闡述了谷歌研發DeepStereo系統的全過程。


早在DeepStereo之前,就有類似利用靜態圖片輸出動的技術存在。美國計算機協會計算機圖形專業組(SIGGRAPH)就曾通過網上圖像製作過延時動。

但與其他靜態圖像生成動技術相比,DeepStereo系統最大的不同在於,它可以猜測出圖像的缺失部分,在空白處創造出來源圖片中沒有的新圖像。據英國媒體Register報導,和傳統動利用視覺暫停的原理不同,DeepSteoreo可以“想象出”兩幅靜止圖像之間的面。

弗林和他的合著者在論文中寫道,“這項技術與之前的品截然不同,我們嘗試採用新型深度架構直接合成新圖像,不需要預先設置景深、焦距等訓練數據。”

該系統背后的網絡架構原理十分複雜,借鑒了各種先例。但作者在文中介紹了該技術的獨到之處:系統在工作時會採用兩套獨立的網絡架構。其中之一會根據已有的2D數據預測各個像素的景深。另外一個則會對色彩作出預測。兩者共同以2D圖像的形式完成對景深和色彩的預測,最終合成視頻。

DeepStereo仍有不足之處:視頻角落的面很不清晰。“算法沒有涉及到的區域往往是模糊的,無法被覆蓋,也無法使用像素填充,”開發團隊解釋。不過,這套系統暗藏了一個通過模糊的圖源生成物體的小技巧:“移動對象在訓練數據中非常常見,我們的模型可以優雅地完成這個動作:開始出現的時候是模糊的,然后逐漸轉換為運動模糊效果。”

雖然該系統生成的最終品與通過圖像簡單合成的動區別不大,但該技術能夠為谷歌的街景技術錦上添花。同時也能為谷歌的人工智能技術提供一個更加實用的範例。

本月,谷歌的“夢想機器人”在互聯網上走紅,這是該公司超級先進的人工神經網絡,由谷歌的工程師團隊開發而成。設計初衷是要找到一種切實可行的方法,讓計算機辯認出圖像中的內容。谷歌工程師正在教這些不可理喻的人工“大腦”辨識動物或架構,順便也做做“夢”,此舉令人感到震驚和恐懼。(斯眉)

文章標籤



Empty