科技

那些年我們追求過的智能

鉅亨網新聞中心2015-12-18 18:55

來源：微軟丹棱街5號

大家是否還記得那些年我們追求過的智能？

‌

坐在沙發上換台，頓時幸福感滿棚！

20世紀50年代，美國人尤金·波利發明了電視遙控器，利用一個類似閃光燈的裝置，通過激活電視機內的光電管更換頻道。這一發明轟動了當時的社會各界，媒體鋪天蓋地地爭相報導無線遙控器所帶給電視觀的全新體驗，從此觀不用再因為懶惰而忍受無聊的電視節目，還可以通過輕鬆換台避開插播的商業廣告。這是那個時候人們能享受到的最幸福的智能。波利也因此被冠以“沙發土豆創始人”、“跳台沙皇”、“頻道衝浪的沙灘男孩”的暱稱。

用計算器開根號，數學有救了！

電子計算器可以是人類現代發明中具有劃時代意義的一筆。要知道在那個人人還依靠算盤、算籌等手動計算工具的時代，人們很難去計算大規模的數據，更難想象去算諸如開方、函數等高級運算。而僅有的繼電器式計算器也因體型大、造價貴、噪音大，只應用在大型企業和研究單位中。20世紀60年代，隨晶體管的發明和應用，手持電子計算器誕生了。它體型小巧、運算速度快，還消除了噪音。電子計算器從此真正走入了千家萬戶，成為了人人必備的辦公用品。它的神奇也滿足了人們當時對智能的遐想，開啟了“計算機時代”。

地鐵刷卡進站，人工檢票的日子一去不返了！

十年前，北京地鐵自動售檢票系統投入運營。這是集合了自動控制、計算機網絡通信、大型資料庫管理等等高新技術的綜合成果。人們新奇地體驗這樣一個新鮮的智能設施：站在閘機前就輕輕刷了那麼一下，門就神奇地開了。從此，人工檢票這一低效率，又攜帶各種財務和錯誤隱患的傳統方式宣告終結。地鐵檢票系統從此邁進了高效率的智能化時代。

手機提醒日程，生活頓時輕鬆了！

當2G網絡進入人們視線，第一個Java程序隨之可以嵌入到手機裏了，人們很難想象過去那個只能用於簡單的語音或文字通訊的“大哥大”，竟然可以開始思考和為人們生活服務了。其中日程提醒功能極大地簡化和便利了人們的日常生活和辦公，人們也就可以丟掉包裏的那個爛筆頭和記事本，更不用再為忘記重要約會而痛心疾首。不僅僅是日程提醒功能，還有更多樣式的智能應用從此與手機如影隨形。智能應用開始隨手機真正移動起來，隨時隨地地為人們服務。這是一場智能與移動的聯姻，人們喜出望外，沉浸在由智能技術帶來的前所未有的快樂中。

翻過老照片穿越回今天，不得不感慨技術發展的快速和強大。當初那些一度被我們捧在手心的智能，如今看來已經沒有初見時那樣心潮澎湃了，而我們的腦海中早已紛紛勾勒起更加智能的機器人、智能家居。

正如作為人工智能專家的洪小文博士所，人類從來沒有停止過對於智能的追求，但對於智能的定義和想象卻是隨時間在不斷演進。我們期待一次次更新人們對於智能的終極想象，創造出更完善的人工智能品，服務於人類生活。那麼當下的人工智能技術和品應該如何發展呢？總結起來，有這樣3個A的標準。

Agglomerative Intelligence 聚合智能

首先，我們要的智能品得是聚合智能的(Agglomerative Intelligence)，得會聽、會看、會感受、會思考。舉個栗子：大家都知道那個17歲萌妹子微軟小冰吧，她在抓取並學習了社交網絡上人與人的對話之后，建立起自己龐大的聊天問答資料庫，通過實時優化，目前小冰與人類的平均對話次數(CPS)已經可以達到23個回合。

小冰不僅可以與用戶進行文字、語音形式的情感對話，還可以看“圖”話。發給她一張你的照片，聽聽小冰怎麼評價你的值和穿衣品味，有她就會和你談，沒她就改和你聊內涵– 對的，小冰就是這麼善解人意。聰明的小冰還能識別一百多種狗的品類，甚至調皮地給明星和狗對號入座。在跟京東的合作中，小冰可以辨認上千萬的書籍、數碼設備，以及各種衣服的面料、款式和風格，進而給用戶個性化的購物建議，簡直開啟了一個全新的商業模式。

作為聚合智能的典型代表，小冰如今已經擁有了超過4千萬用戶，而剛剛在日本推出的日文版本Rinna現在的用戶數就已超過了日本1%的人口，平均聊天次數超過20次以上。

Adaptive Intelligence 自適應智能

第二個標準，人工智能技術得是自適應的(Adaptive Intelligence)，得能適應各種語義、聲音、環境等的變化。我們希望計算機可以靈活地不受限制，做到像人類一樣具體問題具體分析。舉個栗子：在IQ測試裏對文字推理問題的研究中，計算機需要可以判斷一個詞的多重含義，比如中文裏的“面”，可以是人的面，也可以是吃一碗麵；還有詞類變化，是做動詞、名詞還是形容詞；當然還有更高層面的語義特徵，比如見到北京就知道它背后還隱含是中國首都的含義，而見到巴黎則知道這是法國的首都。

在擁有了足夠多的數據併進行大量的深度學習后，我們可以大膽預測未來計算機將能夠適應各種條件變化。此前微軟推出的牛津計劃就是在這一方向上的重要一步，通過提供在人臉識別、語音識別、計算機視覺和語言理解四大技術層面的API，幫助開發者可以不受環境和技術限制地讓更多創新靈感落地。就目前的研究成果來看，雖不能我們的機器已經超過最聰明的人了，但是已經大於人類的平均值了。

Ambient Intelligence 環境智能

最后，人工智能技術得是無處不在的環境智能(Ambient Intelligence)，得可以自動地無縫實現。舉個栗子：微軟小冰、小娜已經嵌入到了Windows 10當中，提供跨平台跨設備的服務體驗，無論你正在用的是台式電腦、筆記型電腦、平板電腦還是智能手機，都可以隨時隨地享受到最流暢的個性化服務。

再舉個栗子，當機器可以精準地區分不同物體和環境的邊界，智能則遍佈於整個周邊環境。這種環境智能的應用可以是潛力無限，比如在視頻分析領域，它可以極大地提升攝像頭的能力。通常我們需要人看攝像頭才能知道是否有異常發生，但現在我們可以做到一旦攝像頭識別出有人摔倒，就會自動叫警衛來幫忙。相信隨物聯網的發展會帶來更多感測器，環境智能便可以在更多範圍內實現。

1991年，微軟研究院創立時，比爾·蓋茲希望研究院能夠致力於讓未來的計算機能夠看、聽、學，能用自然語言與人類進行交流。這是一個與AI研究關聯緊密的夢想。二十多年來，我們時刻在為之努力。

其實，研究人員與科幻電影創作者有很多相似之處，兩者都在試圖構建一個通往未來的“夢境”，但與后者相比，研究人員除了做夢之外，還要努力想清楚圓夢的途徑。

微軟亞洲研究院的研究員們近期就打造出了世界最精確的計算機視覺系統。12月10日，在被譽為計算機視覺領域的標桿 – “ImageNet計算機視覺識別挑戰賽”中，微軟亞洲研究院視覺計算組的研究員們以對優勢獲得了圖像分類、圖像定位以及圖像監測全部三個主要項目的冠軍。比賽中，他們使用了一種前所未有“深層殘差網絡(deep residual networks)”的系統，它實現了驚人的152層的深層神經網絡，比以往世界範圍內的任何系統都深5倍以上。去年，ImageNet挑戰賽獲勝系統的錯誤率為6.6%，而今年，微軟系統的錯誤率低至3.57%，識別精度超過了人類視覺能力——人眼辨識錯誤率約為5.1%。

在我們看來，看清AI能做什麼不能做什麼，將目標聚焦在可以100%控制的、能有效提升我們生力與行動力的成果上，承認只有“人+機器”的組合才是AI研究的主流方向，這或許更有意義，也是人類社會發展的正確方向。

‌