全球AI領軍人物,《AI新世界》作者——創新工場董事長李開復,在全球做了300場演講後,應遠見.天下文化事業群邀約,於7月24日來台進行一場名為【AI新世界】趨勢論壇,現場一位難求,產官學界重要人士齊聚。《遠見雜誌》特將演講內容進行精華摘要,讓無法到場的讀者一睹為快。
我在大一時開始做人工智慧,走了這麼長的路,也碰到很多挫折,而我一直堅持做下來。《AI新世界》這本書現已在四個國家出版,還有21個國家即將在今年底出版,應該是全世界最暢銷的AI相關書籍。
首次發佈在台北,雖然一開始,我是用英文寫的,但是遠見.天下文化的團隊太有效率了,他們將書翻譯並出版時,美國都還來不及出版,而今天,也可能是本書最後一次演講,因為我又要寫新書了。
如今,我又更新本書,前40、50頁加了很多內容,自去年九月出版(英文版後)至今,我已在全球各地做了300場演講,幾個航線加起來一共有60萬英哩。
很多人問我,這麼多演講的總結是什麼?連我的孩子,他們還在讀書、還在找機會,都問我:「你看你的日子這麼好過,各國家領導、CEO都要聽你演講。」我說不是這樣的,畢竟出這本書時,我在美國其實沒知名度,我是努力地用演講,一個一個做出來。
過去,我在中國大陸和台灣出書時,最多十場演講,這次我講了300場,因為我覺得我有話要說,本書若要全世界人都聽到,首先美國人要聽到,而許多人想聽,其實因為興奮。那麼在這300場演講,60萬英哩的累積下,我對AI又更多認知了。一方面技術還在發展,另外,每次演講都被提問,我就把問題整合起來。
關於AI的四個方向
今天我要講四個方向,分別是一、什麼是AI;二、AI應用的四波浪潮;三、中國AI的機遇,以及四、AI會帶來什麼挑戰?
39年前,我做了不少AI的工作。在1986年,我就做了第一套可以工作的語音辨認系統,在當年得到《紐約時報》半篇報導,蘋果電腦也將之做到了他們的產品裡面,然後在《華爾街日報》也接受了一個採訪。
在過程中,我其實也看著人工智慧,每次看起來好像可以工作了,或被預言,人類要毀滅了,但最後發現好像還不可行。一次的發現,一次的失望。這次大家又面臨了所謂的「深度學習」,那我們是不是又會失望呢?
我很確定的是,深度學習已被廣泛接受,而且會對業界帶來顛覆和改變。
我們可以看到不斷地有新聞出來,如AI打敗了圍棋冠軍、打敗很多電子競技遊戲、AI比醫生更會看一些片子。在高考方面,AI在中國已經可以考上醫學院,在日本也快要可以考進東京大學。AI的閱讀測驗超過了99%個學生,還有語音辨認、人臉辨認,都已經超過了人,甚至是頂尖水平。
這都是過去五年中做出的。很多人擔憂,是不是代表AI要控制人類了?其實不會!因為這些突破,都是基於深度學習這一套技術,如果我們回頭看AI過去這60年來的種種發展,最大的一個就是深度學習。
什麼是深度學習?
那深度學習是什麼?他跟人腦完全不一樣。不像人類可以有創造、戰略、自己的想法、感情。他其實是一套數學公式,然後他是在海量的數據下,能做出非常聰明的決定。比如說我做的那套下棋軟體和語音辨認,都是基於統計的系統。
這些統計系統其實是相通的,厲害之處不來自人寫的程式,而是給他海量數據,讓他自己成規則,有能力決定。
這些規則不要人去控制,控制越多,機器反而越作不好。因為人的思維跟機器不一樣,機器是基於大量數據,用統計方法劃分,所以數據越多,結果越好。因此,深度學習其實就一個神經網路,輸進大量數據,告訴他正確答案應該是什麼,他就會做得非常好。
我先講一個自己博士論文的故事。其實,1984年我就看到,統計用海量的數據,絕對是比用規則更好。於是,我就跟我的老師申請了巨額的經費。
當時我每個月的獎學金是700美元,其中,付房租四百,吃,三百,正好用完,後來我斗膽再跟老師要十萬美金,說:「你相信我的話,我不用你的規則法來做AI,我要用我的統計法來做,但是我需要用十萬美金買一套硬碟。」那時,硬碟重達200公斤,後來他准了,開啟了我語音辨認工作。
所以我非常感恩我的恩師。你可以想像,他給一個每月700美元研究費的研究生10萬美元,而你猜猜,10萬美元買了多大容量磁碟 ?100mb。
當時我就是靠著100mb做了世界最大的語音資料庫,做出最好的語音辨認系統。如今,語音辨認的數據,至少多100萬倍。我當時用的算法也不行了,因為那套演算法只能在100mb工作,現在則至少100T。
當年發明深度學習的Yann LeCun,他在1989年也做了這個,而我是1988年畢業的,我們是同一代的人,但當時他的結果一直不怎麼樣,而且論文不斷被各種會議質疑,他大部分是做圖像,我在做語音。
但是後來事實證明他的方法才是正確的,我的並不是,只是我的方法是取了個巧,用100mb,也能做出結果,他的是需要100T才做得出結果,後來也得到了圖靈獎,這是他們應得的,他們堅決認為,若有海量的數據,非常快速地計算,才能讓AI真的執行起來。
回到深度學習,比如,我們要做一個貸款的軟體,那麼就把人還款不還款,做為訓練基準,然後把人的所有數據都餵養進來,包括手機款式、住處、薪資、手機上有什麼APP等等……。最後他還錢了,就是正面回饋,不還錢就是負面回饋,所以整個深度學習,就在學,如何分出還錢和不還錢的人。
其實,做機器翻譯或是語音辨認,也都是這一回事。而後來,互聯網則發展到,可以倒過來跑,他不但可以告訴你答案,還可以導出這個人可能會說什麼。因為他倒過來了,不只是把人話餵養而進,來識別人說了什麼,而是聽了夠多的話,可以預判,他會怎麼講話。
所以深度學習非常神奇,可以做分類、預測、決策,也可以做深層。
深度學習的例子:八個不懂AI的小朋友都可以操作
我來演示一個例子。這例子最有趣的是,他並非任何的科學家做出的,而是由八個不懂AI的小朋友,做出的一套軟體。這是一套hiphop作曲家軟體,用海量的嘻哈歌訓練機器,然後給機器一個詞,他就能作曲。
畫面中的詞就是去年我出的題目,我說:「你們就寫首歌,歌名就叫做『創業的路上』,」於是這就是製作出來的結果。
澄清一下,影片中,這是人唱的,不是機器唱的,但實際上,你要做一個機器唱的,那再給我16個小朋友,我們也做的出來。並沒有任何的難度。唱歌,從來不是一個難題,唱的好聽是難題,但是唱歌不是難題。所以現在AI已經到了這個地步。
若再有人跟我說:「AI,好高深啊,這怎麼辦啊?大學生都不會,怎麼趕上美國、中國?」八個學生能做出這個,我們的台大、政大為什麼不能做出?AI的門檻在快速的降低。
另一個例子,是無人駕駛,也是八個小朋友做的,他們在北大做了一個高清地圖,把北大所有的路勘測了一遍,然後做了高清地圖,以後,他可以從任何一個教室開到任何一個教室,在中間不會撞到人、腳踏車。
當我們談到深度學習到底需要什麼?一年前,我用的條件跟今天一樣,第一個需要海量的數據;第二,需要客觀、精準、自然的標註。
怎麼說呢?就是我不要找人去標註,最好是自然的標註。
一如要用AI判斷投資,不是要派個專家來解析,很簡單,只要標註,一個股票只要漲就是好,跌就不好。而每個股票都有噪音存在,但是如果有海量的數據來訓練他,包括每一個分析師、每一個社群網路所分享的對某支股票的內容,再把這些人的臉書給找出來,看他這個禮拜快樂不快樂?
第三,AI其實蠻笨的,他只能在一個領域工作。所以如果我們做了一個很好的貸款機器人,他絕對不可能變過來做機器翻譯,那是另外一個機器,所以每個AI只能做一件事情。
第四,很多電腦,很多數據,以及頂級的AI科學家,如今已不需要,只要AI工程師就好。還有未來的AI,可能有各種的技術,深度學習是其中之一。
AI發展的四波浪潮
下面給大家講一下AI應用。我的書裡描述了四波浪潮。
第一波,互聯網上有海量的數據,我們每天都像白老鼠幫助標註數據。比如說,當我們每次在臉書點讚的時候,都是告訴臉書說我是這樣的人,那麼臉書就更知道該給我看什麼東西,然後臉書能用此來定一個目標函數。
什麼是目標函數呢?運用目標函數,你可把你的業務目標,變成目標函數,讓AI變成了一個可優化你的業務目標的機器。假設我們淘寶,藉由龐大的用戶點擊行為,由於每個人看的網頁都是不一樣,那麼機器人就可以判讀出你的喜好,可以找出一個目標函數,提供用戶最需要的東西。所以AI的厲害在於他能超過人類,個性化地給每一個人不一樣的東西。
過去,媒體也好,電商也好,很難針對每個人,提供不同的服務,進而將業績極大化。而今,互聯網公司動耴業績三、五百億元,很大一部分是,他們能用AI把大數據變成商業的利潤。
第二波,不只是互聯網在活用海量的數據,金融業、保險業、銀行、證券投資……等,也在用數據。尤其是金融,由於他就是一個虛擬遊戲,跟互聯網相似。
第三波,就是把AI提升到一個不只是大數據,而且是感知的過程。他的感知是能夠把在實體世界上看到、聽到、感覺到的各種東西變成數據,再讓他去做AI。
所以你可能會覺得,是不是可以語音辨認、人臉辨認、物體辨認,當然是。人只能靠嗅覺、味覺進行判斷,但機器,可以判斷熱值,分析動態,然後還可以做出3D的重建,這是人做不來的。
以後機器的感知更遠遠超過人,不只是在辨認人或體,他可以辨認一個動作,然後把這個動作變成商機。
舉個例,張學友六個月前在中國大陸做了五次演唱會,來了9萬個人,演唱會完了以後,23個逃犯被抓起來。因為每個人在進去的時候,都被人臉識別掃了一遍,掃了以後,發現這個人有嫌疑,那麼員警就會來過,看看身份證。
你想,若你是逃在深山裏的逃犯,怎麼會想到混進幾萬人裏,會被認出來?但,人臉識別系統,卻可同時辨認300萬張臉,第二,他能可以一秒六十幀的速度快速地辨認。所以在你入場的那一剎那,即便你用手遮著臉,但只要你手一放下來,就被看到了。因此,AI已把人遠遠的甩在後面,並足以改變世界。
第四波浪潮會稍微慢一點,因為他會要動,讓機器有手有腳,機器人無人駕駛,能夠動、能夠取代流水線工人,能夠取代你的司機等。第四波浪潮會比較慢,但是現在也在快速進步,所以這四波浪潮是同時在發生。
四波浪潮已經覆蓋了整個社會
其實你把四波領域全部加起來,差不多就是今天的經濟,而且已經覆蓋了整個社會。
創新工廠作為AI早期投資人,我們在2012年就開始投資,你看到我們在四波浪潮都做了很好的佈局和投資。在AI領域的投報率,每年都接近三位數一年吧。
舉例子而言,現在AI客服已經能夠接聽80%的電話,可以想像能省多少成本,但同時也取代多少工作。
北京一個叫原麥山丘的麵包店,已經沒有人了,都是自動結帳,你把麵包一放,馬上價錢就出來了,而且若試著把一個小麵包藏在大麵包下面,還會被抓到呢。因為三維重建,可以知道一個麵包有多高,如果一個麵包飛在空中,就表示下面還有一些麵包。
另外,AI教室就是未來的老師,由AI來做各種重複性的工作,包括改考卷、出功課、講課。然後在初級班裡面虛擬老師是也可以的。例如,我們現在已經可以做出一個AI的遠程英語老師,小朋友根本分不出來這是虛擬的。
在中國的農村,小朋友大多都在貧窮的環境成長,要走一小時甚至一個半小時的路上學,而且,很可能,一整個小學,六個年級的所有課程都只由兩位老師教導,所以我們帶進了遠程老師,是北京一個名師的分身,遠程名師講較難詮釋的東西,而當地的鄉村老師變成助教。
至於遠程老師,也可利用人臉辨認,來認學生,藉此進行師生互動,針對每個學生的需要,幫助修改己英語口音、數學基礎知識,這都已在真實社會運營,不是天方夜譚。
中國在AI發展領域目前超過美國
中國在AI方面其實握有非常好的發展機會。
每年圖靈獎得主,會有一到三位得主,而在AI領域,全部都是美國人和加拿大人,無一例外,因為,過去美國一直是領先全球。
但過去的十年中,因為中國的市場太大,吸收了很多的投資在AI上的錢及投資人,這些投資,幫助創業家達成了夢想,打造世界級的公司及好產品,而再又吸收更多人進入中國。因此,這讓中國與美國分裂成了兩個平行的宇宙。舉例來說,今天在中國的App,和美國就是幾乎截然不同的兩套系統。
十年前,中國幾乎都是模仿美國,但,後來中國慢慢有了微創新、慢慢有了好點子,針對中國本地的需求,又做出了更多的創新。一如抖音、MOBIKE等,這都是幾百億、上千億美元的公司。這些公司所做的業務的是美國完全沒有的。
於是,在這個裂變的過程中,中國變成了一個創新的大國。
當年,我有幸創立了微軟亞洲研究院,這個研究院為亞洲,尤其是中國培養了5000個人才。那麼這些人現在都是分佈在阿里、騰訊、華為、聯想等,他們的AI負責人都是當年從研究院出來的。
每個暑假培訓六百個學生,也包括了臺灣的學生。五個五週之後,他們就可以做出AI創作,所以,在門檻降低下,有更多年輕創業者出現。
在數據為王的AI領域中,中國最大的優勢是,數據最多,無論是在移動支付或用戶數量,就連外賣訂單量,都是美國的很多很多倍。
僅僅在2018年,中國整體的移動支付就是40萬億,比中國的GDP還大三倍。而這麼大量的數字,全部經過數位網路產生,所以拿這來作AI訓練的基礎資料,會使得機器人無論對用戶的購買行為、對貨品、當地、電商,甚或整個零售業的瞭解,都特別特別巨大。
他不只對阿里、騰訊有很大的幫助,對每一個商家,有這個資料的都有幫助。那麼沒有這些資料的國家其實在整個電商服務發展,甚至在金融投資保險的發展,都會相對落後。
你可能會說美國不是也有嗎?但實際上,美國是封閉式的數據,而且這些公司他們本質上不是一個大數據公司,也不是一個AI公司。所以中國在這方面其實已經遠遠超過了美國。
中國AI生態將快速改變世界
再比政策,中國國務院的政策和美國相比,應該是差不多、平分秋色,但在應用和價值的產生,中國還會略勝一籌。也可以說,再繼續發展下去,中國的整個移動互聯網跟AI應該都會滲透到世界各地。雖然今天你認為全世界是美國為主,只有中國是以中國為主,但這樣的生態已經非常快速的在改變。
假使你到東南亞、中東、非洲,包括印度,問當地年輕人,do you use tiktok(抖音)?很多人就會說yes,抖音是中國現在出口最快的一個產品。
在全球,尤其中美等七個巨頭,每年培訓幾十萬個AI的專家,大量的投資投入AI領域,當年愛迪生是到銀行去借錢,才開創了通用電氣,而今,AI公司卻是幾千萬幾億甚至幾十億的去融資,所以是不可同日而語的。
從愛迪生發明電,到第一個國家電網的產生,都是好幾十年的事情,落後的國家,還可能要花超過一百年。
但AI電網,就是在雲端上用cloud架 AI,今天你用google cloud、亞馬遜AWS、阿里雲,上面都有AI的功能,這意謂著使用AI的成本,正快速下降,這就是剛才我所舉例的,五個禮拜就可以訓練一批不懂AI的小朋友,做出成品。
這一都告訴我們AI普及的日子應該很快就會到了,那到底會有多快呢?
我們可以用互聯網來作案例。當網景出來時,人們覺得說互聯網和火箭科學(rocket science) 是個黑科技,後來慢慢發現互聯網不就是B2B、server什麼的,再後來,就發現,企業開始弄個AI部門,一開始只從最需要互聯網的部門開始,最後發現每個部門都要。
其實過6、7年,AI就會到處都是,因為AI的學習成本、使用成本將會降到接近0。
所以我們一定要不斷地切換投資的策略。舉個例子,比如說在業務外包流程,現在用AI可以節省91%的成本,在呼叫中心80%可以用AI代替。在這樣的背景下,AI會創造大概15.7萬億美金。在未來的十一年中,這大概就等於創造了一個中國加印度。
AI為我們帶來什麼問題與挑戰?
只是,AI會不會帶來很多問題呢?其實我們如果看媒體,尤其是看美國、歐洲媒體,會發現AI其實出現了很多挑戰。
一如隱私問題。最近臉書出了很多的麻煩,讓很多人認為,應該就把數據還給個人。尤其是歐洲推的GDPR,就主張數據應該是個人擁有,然後他選擇授權給哪個公司、哪個服務,這個聽起來很正確。但實際上,如果你去歐洲的任何一個網站,會一直跳出一些詢問框,你得一直按yes、yes、yes,快煩死了。
確實,隱私濫用,是個問題,但,若你把這樣顆粒化的問題留給用戶來決定,用戶是沒法決定的。所以我認為更好的解決方案是什麼?一定是用技術,不只用政策、用規範,用罰款來處置或者用拆解AI公司就能解決的。
我覺得現有兩套技術,一個叫聯邦學習,一個叫同態加密。
其大概的理念就是說,做為google、做為一個公司,我知道的一些秘密,比如說你的年薪,我想要用這個年薪,來推送你更好的內容。但是你肯定不希望我知道你的年薪,有沒有方法我能加密,然後用加密的數據來訓練我的AI,而且我沒有辦法逆向的導出你的秘密。這個聽起來很難,確實很難,但不是不能解決。
還有一個問題,比如說我在台大看病,台大有各種我的數據,所以他可以訓練一套怎麼去辨認淋巴癌的模型。可能榮總、和信也有一套,如何讓他們彼此不能把病人的數據互通?
其實運用聯邦學習,讓每個醫院可以訓練一套AI方法來做AI醫生。他們不分享病人的數據,但是他們把所有的醫院的模型全部聯合在一起,變成一個超AI模型。這為什麼不可能?所以我覺得各個政府跳進來要管AI、要拆公司的時候,應該先想一想,其實應該要考慮技術的問題,只能技術解決。
安全,也是一個問題,比如說人臉貼幾個貼紙就辨認不出來,車子畫一些符號東西,其他的無人駕駛就看不出你是車,其實還是有很多漏洞在裡面。
另外,就是深度造假,我們可以看到,無論是川普總統的語音或者歐巴馬總統的影片,都有AI能造假出來,他們明明沒有講話,看起來都是真的。
這能怎麼辦?這個絕對不可能是靠人眼來解決,因為人如果能看的出來,大家就不會相信了,這一定是靠技術來解決。
未來什麼樣的工作不會被AI取代?
另外,AI取代工作的問題,當然也很嚴重。
其中,重複性、日常性、優化性的工作都非常的危險,只有複雜的工作,還有創意性的工作,比較安全。但是我們可以想一想,那AI到底不能做什麼?其實AI不能做很多東西。在我的書裡會列出來幾十樣AI不能做的事情。但這裡為了簡化我們的思考,AI大概有兩件巨大的事他不能做。
第一個,AI沒有創意,他不可能發明一個新的印象派的畫,也不可能做一個新風格的音樂,也不可能發明一個新藥,也不可能有新的可以得諾貝爾獎的經濟學理論。另外一個問題是AI沒有自我意識,AI做這些事情都是為了解決問題、為了優化、為了達到更高的結果。
比如說ALPHAGO打敗了柯潔,他沒有感覺任何的高興,他不瞭解他為什麼要下棋,然後若把插頭拔掉他也就算了,他不像柯潔在這邊流著淚。即便有些AI是可以模仿人的感情,假裝是笑或是傷心,但錯的概率很高,而且錯的很離譜。即便以後錯變少了,人是不希望被機器來照顧。
所以可確定的是,未來2、30年之內,創意性的工作,還有愛與關懷的工作,AI是做不來的。
如果我們相信這一點,未來的工作其實不是一刀切割,都被AI拿走了。只有是那些低關懷、低創意的工作是AI會取代的。比如說創造一個新的藥物,那是可以用AI作為工具,幫助科學家創造更多。
至於高關懷、優化的工作,是可以用AI做為一個內核,來做很多分析,而人,就來提供溫暖,以達到1+1=3的結果。
比如說讓AI來改考卷,老師來做人生導師。比如說未來用AI來做醫療的判斷和給藥,還有什麼手術等,但是人是來提供關懷,聆聽每一個病人,他的苦在哪裡?讓他們有更多的信心,讓他們可以康復,去他們家裡關懷他們,可能更多的是一個高EQ的醫生,而不是一個背了很多醫藥常識的醫生。
至於政府,能採取什麼措施呢?其實要很清楚的認知,AI創的每一個工作都是非重複性,AI取代的工作都是重複性的。所以每一個要下崗的人,他都是從重複性的工作下來,然後再也找不到一個重複性的工作可以去做,所以他必須要經過訓練,才可能進入一個非重複性的工作,所以,對人的重新培訓,十分重要。
不過,我想強調的是,我對科技是樂觀的,科技本身當然是中性的,我們可以從每一次科技革命上,看到每一個科技被用在正面的地方遠遠大於負面的地方。科技帶來了更多的好處,科技帶來的挑戰都是可以克服的,而且科技本身帶來的挑戰應該由科技解決。
關於AI的四個結論
最後有四個結論。
AI是跟電一樣,將會改變人類的歷史。
AI已經過了發明時代,現在進入應用時代,而且應用會越來越容易,影響所有的行業。
第三、AI確實有很多重大的挑戰,但是我們是不是可以克服?
最後,AI可能會取代不少的工作,在未來2、30年給我們的孩子帶了不少的挑戰,但是未來30年,我們會發現,其實AI對人類帶來一個巨大的福利,因為他們其實把我們重複性的工作取代掉了,我們就不需要再做日常重複性的工作,讓我們更有時間做我們愛做的事情,讓我們更有時間來思考人類是為什麼存在。
在演講完後,由前政大校長周行一主持交流論壇,包括前行政院長張善政、安聯投信投資長張惟閔。本論壇內容則全程錄影。
https://www.gvm.com.tw/article.html?id=67437