科技

谷歌黑科技：能把照片變立體

鉅亨網新聞中心 2015-07-10 16:26

‌

新浪科技訊北京時間7月10日下午消息，據美國科技博客Gizmodo報導，本周《麻省理工科技評論》(Technology Review)雜誌發布的一篇論文披露了谷歌研發的新系統DeepStereo，該系統可以通過人工智能技術將一系列照片無縫組合成為視頻。

論文作者名為約翰-弗林(John Flynn)，是一名谷歌工程師，其他三位合著者也都在谷歌工作。在論文中，弗林闡述了谷歌研發DeepStereo系統的全過程。

‌

早在DeepStereo之前，就有類似利用靜態圖片輸出動的技術存在。美國計算機協會計算機圖形專業組（SIGGRAPH）就曾通過網上圖像製作過延時動。

但與其他靜態圖像生成動技術相比，DeepStereo系統最大的不同在於，它可以猜測出圖像的缺失部分，在空白處創造出來源圖片中沒有的新圖像。據英國媒體Register報導，和傳統動利用視覺暫停的原理不同，DeepSteoreo可以“想象出”兩幅靜止圖像之間的面。

弗林和他的合著者在論文中寫道，“這項技術與之前的品截然不同，我們嘗試採用新型深度架構直接合成新圖像，不需要預先設置景深、焦距等訓練數據。”

該系統背后的網絡架構原理十分複雜，借鑒了各種先例。但作者在文中介紹了該技術的獨到之處：系統在工作時會採用兩套獨立的網絡架構。其中之一會根據已有的2D數據預測各個像素的景深。另外一個則會對色彩作出預測。兩者共同以2D圖像的形式完成對景深和色彩的預測，最終合成視頻。

DeepStereo仍有不足之處：視頻角落的面很不清晰。“算法沒有涉及到的區域往往是模糊的，無法被覆蓋，也無法使用像素填充，”開發團隊解釋。不過，這套系統暗藏了一個通過模糊的圖源生成物體的小技巧：“移動對象在訓練數據中非常常見，我們的模型可以優雅地完成這個動作：開始出現的時候是模糊的，然后逐漸轉換為運動模糊效果。”

雖然該系統生成的最終品與通過圖像簡單合成的動區別不大，但該技術能夠為谷歌的街景技術錦上添花。同時也能為谷歌的人工智能技術提供一個更加實用的範例。

本月，谷歌的“夢想機器人”在互聯網上走紅，這是該公司超級先進的人工神經網絡，由谷歌的工程師團隊開發而成。設計初衷是要找到一種切實可行的方法，讓計算機辯認出圖像中的內容。谷歌工程師正在教這些不可理喻的人工“大腦”辨識動物或架構，順便也做做“夢”，此舉令人感到震驚和恐懼。(斯眉)

Meta還能繼續爆發嗎？
掌握全球財經資訊點我下載APP

文章標籤

‌

上一篇
富士康在越南手機工廠項目遭撤銷
下一篇
1號貨的獲得天神互動CEO領投數千萬A輪融資