謝耘:永不能實行人工智能 但計算速度可越來越快
鉅亨網新聞中心
和訊網訊息 7月4日,由中關村(000931,股吧)科技園區管理委員會、中國科學院國家科學圖書館主辦,北京長風資訊技術產業聯盟、神州數碼“發現城市”創新論壇承辦,中關村社會組織聯合會協辦中關村創業論壇第108期在國家科學圖書館舉辦,結合“大數據時代,中美it產業是否將‘分道揚鑣’”等話題,知名大數據專家涂子沛、神州數碼首席科學家謝耘分別發表了精彩演講,並展開對話。謝耘表示,探討數據與主體的關係將成為未來it應用發展的一個最為重要的課題。
以下為謝耘發言主要內容:
今年年初我參加了一個年輕朋友的讀書會,咱們中組部的一個朋友就問了我一個問題,“謝老師,現在都大數據時代了,你能不能幫我們設計一個系統,我把一個局長的材料等等的資訊全放在系統里,然后你就能告訴我這個人能不能當副部長,以后能不能當部長?”大數據確實引發了我們對智慧的這種無限的遐想。當時我給他的回答,如果一件事情沒有人知道該怎么做的話,其實計算機也不會替你做。大家聽懂這句話了嗎?在座的朋友可能很奇怪,計算機做的很多事我就不知道該怎么做啊,不是還替我做了嘛。但是一定有某個人知道這件事該怎么做,計算機才會來做。
為什么講這個題目?也就是因為大數據引發了很多對智慧的議論,所以我今天就想圍繞這個話題講一下,看看能不能講清楚。這也是我個人的觀點,不一定對,供大家參考。
其實人類創造的工具分成兩大類,一類是輔助體能的工具,計算機其實是作為一個計算的工具輔助人的智慧活動。能不能以后代替智慧活動,這是很多人夢寐以求的活動,下面我會做一些分析。
因為計算機是輔助智慧的一種工具,而且計算本身其實是人的智慧活動的一部分。上個世紀四十年代計算機誕生之后,整個的產業很快把興趣從制造能計算的機器,而轉向了制造有智慧的機器。這件事情的一個標志性的時間,就是在1956年的時候一群來自於神經學、邏輯學、數學計算機等等的牛人,在美國開了兩輪會提出了人工智慧的概念。當時人類對造智慧的機器還是非常樂觀的,這是兩個典型的牛人。一個是已經不在世了,叫做hebert,他獲得過諾貝爾將來學將,1965年講20年內機器能完成人能做的一切工作。另外一個牛人還在世,叫做minsky,1970年時講在三到八年的時間里將得到一臺具有人類平均智慧的機器,他們在說什么?大家知道前一段美國一臺機器在答問題的時候還贏了,還有一臺機器通過了圖靈測試,他們說的是不是這樣的機器?不是,當年討論人工智慧的時候講的不是我們現在看到的事情。
當機器能完成人能做的一切工作的時候意味著什么?意味著當年科學家想造一臺機器,這臺機器就和人一樣在開始的時候內置了一些機制,但是是很蒙昧狀態,什么也不知道。讓這臺機器和外界的互動能夠學習,能夠擁有智慧,能夠獲得知識,這是當年討論智慧時候最原始的想法。當年認為這種機器花一二十年能造出來,結果是什么?在九十年代的時候這個努力遭到了重大的挫折。底下那臺是日本造的第五代計算機,1981年開始的,當時引起了全世界的轟動。這臺計算機當時日本傾全國之力來造,他們認為從九十年代開始人類在人工智慧領域已經積累了大量的經驗,再經過十年的時間我就能夠造出這么一臺機器來。這臺機器只需要內置基本的機制和人工介面,它就會自己獲得智慧和知識,不需要你去編程。到1990年的時候這個項目徹底失敗了。
八十年代人工神經網絡,號稱模擬人的大腦神經做一個網絡就有智慧,當年我做博士就是研究這個問題,在九零年前后冷下去了,事實證明並不能達到我們的期望。所以it整個產業其實是在九零年發生了一次歷史性的轉折,就是從對智慧的追求回歸到了對計算能力的追求。發現造一臺和人大腦一樣的計算機不靠譜,什么靠譜嗎?讓計算機越算越快比較靠譜。it產業今天我們看到的格局是在1990年的時候發生了根本的轉折才變成這樣的,在那之前對智慧的追求是非常熱的。
這就是我們看到的今天it產業在做什么?就是讓機器越算越快,把機器越做越小,機器可以把所有的設備都連起來,為什么?就是因為計算機越做越小。計算機核心還是在做計算,但凡能變成計算的問題,計算機都可以解決。如果一個人沒有本事把一個問題變成計算問題的話,計算機就解決不了。剛才中組部的人問我,一個局長能不能當副部長,如果沒有人能夠把這個問題當作計算問題的話,對不起解決不了,給計算機灌多少數據都沒有用,一定有人懂這個事情怎么做計算機才能算。
隨著讓計算機越算越快,做到今天整個it產業迎來了第二個關鍵性的轉變,就是在讓計算機越算越快的道路上又出現了一個重大的轉折,什么轉折呢?就是今天基礎技術平臺在絕大多數的情況下足夠富裕了,不再成為應用的瓶頸。所以it產業從現在開始往未來看,基礎技術平臺主宰整個產業發展的階段已經結束了。在九十年代買pc會問主頻多少,主頻不夠有的銷售商說可以給你升頻,為什么?因為計算能力不夠。但是到今天買手機或pad的時候知道主頻是多少嗎?沒有人關心了,為什么?基礎技術平臺的能力在絕大多數的情況下已經足夠的富裕,不成為應用的限制瓶頸。從今天開始在it產業里面基礎技術平臺將不再主宰未來產業的發展,真正主宰未來產業發展的將會是應用。為什么發生這件事情?就是因為整合電路技術的發展導致這個樣子。
現在整合電路線寬做到最小22納米,就是在一個大頭針的針頭上可以放一億個晶體管,為什么做這么小已經做成了立體的。原來的晶體管是平面二維的,現在已經是立體的了。
再往下做,整合電路還能做到多小?我和英特爾的人談過,他們說最小做到2納米,也是可以在未來十年里再降低一個數量級,十年里硅走到頭了,可以再用別的。
it產業之所以發生第二個轉折就是因為整合電路走到了這個程度,在今天開始it產業真正進入了青年時期,也就是真正開始了黃金時代。在此之前無論it產業創造了什么樣的不可思議的奇跡,那都是序幕。真正的奇跡將會在未來發展,整個it產業波瀾壯闊的前景還剛剛掀開一角。現在好多人在談產業替代的問題,就是it之后誰來驅動社會的發展,我覺得談論這個話題還太早了,it產業對於整個社會整個顛覆性的影響剛剛開始。
舉一個很簡單的例子,《阿凡達》都看過對吧?it在顛覆一個很傳統的產業,就是咱們的電影,可以不用演員了。以前做不到,為什么?因為需要超級計算能力,原來的基礎計算能力做不到,它會非常昂貴。現在基礎計算能力以后足夠富裕,我可以完全用電腦把片子做出來,不需要演員了,以后演員可能會事業,這是完全典型的例子。未來it將會在各個領域里產生今天可能想不到的現象。
下面就講一下人在實現智慧的這條路上有幾個基本的方法,實際上有三個。第一個是形式上的模仿,剛才我說的是人工神經網絡,什么意思呢?我們發現人的神經原是有巨量的神經原,他們之間有大量的連接。從五十年代開始搞人工智慧的有一批人認為,我也造一些很簡單的處理單元,然后把大量的處理單元連接在一起,我覺得就可能會有智慧。這句話聽起來有點像開玩笑,大家不要驚喜,科學家經常也搞不靠譜的事情。如果你們仔細讀科學史的話,其實科學發展歷史上有很多不靠譜的事情,包括很有名的科學家也干很不靠譜的事情,所以大家要記住不要把科學變成一種宗教迷信。
這個事情形式模仿到今天為止別沒有產生很了不起的結果,所謂結果就是非線性函數,非線性函數對樣本集合按照最小差來擬合的過程,這個幾百年就有了,所以形式模仿並沒有成果。
真正成功的是后兩個,分別是機制模仿和機制替代。什么是機制模仿?我們做一件事情完全是按照人的大腦做事的方式做,比如下棋,比如計算機可以挑戰世界冠軍,贏了當年俄羅斯的世界冠軍,機器怎么下棋?也會推演,因為計算快比人推演的過程很要多,最後把世界冠軍贏了。這是通過機制模仿實現特定的活動,前提是要理解這個機制。
第二個是機制代替。這個事情人是怎么做的,我可能不知道。比如說人的視覺,人的視覺過程還是非常復雜的,搞不太清楚視覺過程最後是什么過程。沒有關係,我可以用另外一套機制來實現同樣的效果,所以手寫識別的過程和我們識別漢字是不一樣的,我們識別漢字是拿一個漢字來識別。手寫識別會把整個寫字過程記錄下來,利用寫字過程的資訊和筆劃的資訊來識別,所以整個機制和我們不太一樣,但是效果可以是一飲的。
這三個是核心的三個實現智慧的方式,來兩個是最重要的。
下面是用機制實現智慧走了什么樣的路,這個和大數據就有關係了。最開始實現智慧,人們希望發明一些基本的機制,用這些基本的機制就能使得機器和人一樣通過與外界的互動變得聰明,可以來學習,這就是日本第五代計算機典型的思路,但是這種思路后來碰的頭破血流,事實證明是不可以。到了上個世紀七八十年代在對智慧追求上,人就退了一步。看來我們沒有辦法理解人的智慧過程最底層的機制是什么,靠這個實現不了。退了一步是什么?就是把人的知識灌到機器里,加上一些機制來實現智慧,這就是一種混合的方式。機器其實是預制了人的知識在里面的,這叫什么?這就叫專家系統,這是在上個世紀八十年代非常火的。這個時候我們會發現機制和資訊結合了,和數據開始結合了,知識也是一種數據、一種資訊。
到了今天我們在談大數據的應用等等,其實是第三步,我們會有一些機制,加上知識,再加上大量的數據去實現目標。這就是人類在追求智慧化過程上,用機制來實現智慧化過程的演變過程。最開始僅僅希望找到一些智慧的機制,后來發現不行,所以把這些機制加上知識、數據來做。在整個的過程中,對於智慧概念在不斷的放松、放寬,所以我們今天談的智慧和五六十年代談的智慧其實不完全一樣。因為我們碰壁了,所以把智慧放寬了。今天當我們在談很多智慧應用等等東西的時候,其實很多東西在歷史上都是有的,比如這些演算法或機制,而且在歷史上並不把這些東西當作智慧的東西,因為那時候對智慧的東西要求比較高。只是說后來實現不了,所以這些東西慢慢都變成了智慧的東西,融進了智慧的概念。
今天我們談智慧的概念還是非常寬泛的概念,容納了很多傳統的東西,也包括現在的東西在里面,這就是整個智慧機制實現演變的過程。
我們看一下人腦是不是這樣?人腦不是這樣。我們腦袋里存儲的資訊是什么樣的?是整體。我們腦袋里並不是說這個資訊是為這件事用的,那個資訊是為另一個應用用的。帶人腦底下有一層統一的資訊管理層,所有的資訊在人腦是做整體的結構存在在一起的,從人腦的角度看和計算機最大的區別。當今天的計算機系統也發生了變化,進入了所謂大時代之后,我們要到底怎么管理資訊?還是按照原來的方式把數據按照應用管起來,或者它就是一個塊,咱們先堆起來再說,用的時候再挖。
我在這兒的建議,后面講的會是另外一個我提出的思路。大數據在這里想講一下未來到底有什么樣的技術、有什么樣的應用模式。我想的也是非常龐雜,會有很多不同的做法,我下面講的可能只是其中的一個,而不是全部。但是我認為這個做法可能是非常重要的一點,甚至這個做法顛覆整個it產業,但是它不是萬能的,不是一個包治百病的藥,有人賣這種藥,但是我不賣。
在大數據時代資訊到底應該怎么管理?咱們先不談應用,先談資訊到底應該怎么管理。傳統的管理是按照一個一個應用把數據管起來,在大數據時代大量的數據產生的時候是沒有明確應用的,或者說也明確的應用,但是這個數據的價值絕不僅僅在於這一點的應用。到底我們應該怎么管這個數據?因為管好數據才能有好數據,如果連管都管不好,談大數據的應用就有點瞎扯了,或者只能在很淺的層次上用。我個人一個基本的觀點,在這個時代我們應該按照主體、按照人、按照企業、按照城市,按照一個一個主體界定的范圍把這些數據起來。怎么管?按照數據之間、資訊之間反應的邏輯,而不是像邏輯一樣堆起來。
這是剛才看到的圖,對於一個個人這個資訊應該怎樣管?人腦中的資訊不是雜亂無章的,資訊在腦里也不是一堆垃圾,是有內在邏輯,也是相關的。當我們個人資訊要管的時候應該怎么管?我們應該按照這些資訊具有的人所感知的么在邏輯,把它組織在一起,最後形成一個什么?形成人腦這一部分的虛擬映像,在計算機里構造出了人腦資訊集合的映像,它不是一個倉庫,更不是一個垃圾堆。
反過來如果按照一個城市主體把資訊管起來,整個的系統就會變成這樣子,最底層是所有的資訊采集設備,包括攝像頭、傳感器,以及包括在網絡上的虛擬傳感器去監測整個網絡的活動。所有的數據采集起來並不是灌到應用讓應用去使用數據,而是按照數據所反應的城市各個部分的內在邏輯關係,把他們組織在一起。組織在一起成為了什么?成為了這個城市在虛擬世界里的一個映像。這個數據不是一個垃圾堆,這個數據有了內在整體的含義。在這個基礎上可以對這個數據做更充分的利用,可以做各種各樣的分析、各種各樣的模擬。然后上面的應用可以到映像里去獲取需要的各種各樣的資訊,而不是像原來僅僅局限在自己的系統里。
資訊的價值用這種方式會被更加充分的挖掘出來,而應用也能獲得更加完整豐富的資訊,而且上層應用的變化不影響底層。所以這種方式是和傳統it系統建設完全不同的一個方式,我個人認為未來很多it系統可能會用這種方式來構建,當然不是所有的,也不是所有的資訊都用來構建虛擬映像。但是這會成為一個非常核心的,或者非常重要的一種應用構建的模式,而且這種模式將會對it產業、it應用產生重大的影響。它不僅僅會改變應用,而且會產生核心的一些基礎的技術、基礎的產品、基礎的平臺,整個it產業未來的變化可能遠遠超出我們的想象。
回到個人的例子,如果把個人的應用也按照這種方式來建,底層就是一個個人的虛擬映像,中間是在這個映像基礎上融合的服務,界面層可以人更加自然的互動。這個不是解決大腦低層看不到的智慧過程,而是用來和我能夠感受到、看到大腦的部分想辦法無縫的結起來。這就是用這種方式構建應用未來出現的場景,計算機和你不僅僅在人機互動界面上,你會覺得計算機用起來很順手,而且計算機的應用,特別是計算機對資訊的存儲、管理的方式和你的思維習慣、生活方式,將會很自然的融合在一起。因為這些資訊就是按照你的習慣和思維方式組織和管理起來的,這樣資訊系統和人的接縫更小,最終形成無縫的連接。
放到整個網絡的世界里是什么景象?在整個網絡世界里可能有不同的意義,有不同主體構造出來的核心應用系統,這些應用系統都是以主體的虛擬映像為基礎,最後網絡世界把他們聯結在一起。所以網絡世界也將更加變得有序,更加像真實世界的映像,而不是像今天這樣雜亂無章。
未來的發展如果總結成一句話,就是讓輔助人類體能的工具和輔助人類智慧的工具,都和人逐步無縫接起來,這就是我認為智慧的未來。而不是說我們造一臺機器,讓它和我一樣,和我同樣的智慧,最後來挑戰我。我認為這個目標也許幾百年有可能能夠實現,但是在現在來看未來幾十年、上百年的歷程往后看的話,我認為智慧更多的會按照這個方向去走,而不是造出有獨立人格和人完全有同樣能力的機器。無論數據有多大,我想這個目標在目前看都很難實現。
- 檳城漲勢吸金,資金正悄悄進場中
- 掌握全球財經資訊點我下載APP
文章標籤
上一篇
下一篇