123,123,123

人工智能離現(xiàn)實(shí)有多近？來(lái)看美國(guó)人工智能年會(huì)的最近進(jìn)展

科技 admin 0評(píng)論 2017-05-05 15:35:46
收藏 | 點(diǎn)贊
  

編者按：本文來(lái)自微信公眾號(hào)“硅谷密探”（ID：SVS-007），作者嚴(yán)肅 ，36氪經(jīng)授權(quán)發(fā)布。
這屆美國(guó)人工智能年會(huì)(AAAI)，利用舉辦地在舊金山的地利，特別開(kāi)設(shè)了為期一天的“AI in Practice”的討論，邀請(qǐng)了8家科技公司人工智能的技術(shù)主管，分享在各自領(lǐng)域的技術(shù)進(jìn)展。
本期AI嚴(yán)肅說(shuō)邀請(qǐng)了人工智能領(lǐng)域的資深投資人龍?zhí)?，結(jié)合會(huì)議的要點(diǎn)和工作的實(shí)踐來(lái)一起探討人工智能在業(yè)界的實(shí)踐。
從實(shí)際應(yīng)用角度來(lái)看，關(guān)鍵性的應(yīng)用幾乎不允許發(fā)生錯(cuò)誤，一旦發(fā)生故障可能造成人員和財(cái)產(chǎn)損失，所以對(duì)整體系統(tǒng)包括硬件和軟件的可靠性要求非常高，實(shí)現(xiàn)難度也隨之加大。
而面向物理世界的應(yīng)用，要求系統(tǒng)的魯棒性強(qiáng)，能夠處理物理世界的各種不確定性和復(fù)雜性。
因此，從數(shù)字/物理世界、關(guān)鍵/非關(guān)鍵應(yīng)用兩個(gè)維度來(lái)分析，人工智能的應(yīng)用分成四大類，第一類是發(fā)生在物理世界的關(guān)鍵性應(yīng)用，比如無(wú)人駕駛，畢竟人命關(guān)天。第二類是發(fā)生在數(shù)字世界的關(guān)鍵性應(yīng)用，比如涉及到金融領(lǐng)域和計(jì)算機(jī)安全領(lǐng)域的問(wèn)題，可能直接造成財(cái)產(chǎn)損失。第三類是發(fā)生在物理世界的非關(guān)鍵性應(yīng)用，比如掃地機(jī)器人。第四類是發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用，比如推薦系統(tǒng)。就商業(yè)應(yīng)用路線而言，一般規(guī)律是從數(shù)字世界的非關(guān)鍵應(yīng)用開(kāi)始，逐步滲透到物理世界的關(guān)鍵應(yīng)用。
發(fā)生在物理世界的關(guān)鍵性應(yīng)用
總體而言，發(fā)生在物理世界的關(guān)鍵性應(yīng)用技術(shù)難度非常大，比如高級(jí)別的無(wú)人駕駛，是需要長(zhǎng)時(shí)間的培育和等待的領(lǐng)域。
“AI in Practice”的演講者之一，來(lái)自谷歌的Vincent Vanhoucke以及Waymo(谷歌的無(wú)人駕駛公司)的Dimitri Dolgov都分享了一些研發(fā)機(jī)器人和無(wú)人駕駛的經(jīng)驗(yàn)和教訓(xùn)。
Vincent所帶領(lǐng)的Google Brain團(tuán)隊(duì)目前工作主要集中在三個(gè)領(lǐng)域：語(yǔ)音識(shí)別、計(jì)算機(jī)視覺(jué)、機(jī)器人。而Dimitri引用了加利福尼亞車管局(DMV)提供了2016年關(guān)于無(wú)人駕駛里程及失靈(Disengagements)的數(shù)據(jù)（失靈時(shí)需要人類司機(jī)來(lái)駕駛），這個(gè)數(shù)據(jù)也基本驗(yàn)證了無(wú)人駕駛的難度。
失靈比例最低的是谷歌，每5128英里失靈1次，可以想象的是，谷歌無(wú)人駕駛的測(cè)試數(shù)據(jù)依舊是在一定的限定環(huán)境下，特斯拉則是3英里就失靈1次。
即使是按照谷歌無(wú)人車現(xiàn)在這個(gè)數(shù)據(jù)，在駕駛?cè)绱烁哳l的情況，離完全的無(wú)人駕駛（Lever 4 or 5）還有很長(zhǎng)一段距離。
按照長(zhǎng)期以來(lái)的工業(yè)界的實(shí)踐，把可靠性從90%提升到99%，往往比0%提升到90%難很多，然而從99%提升到99.99%比從90%提升到99%更難，而我們對(duì)無(wú)人駕駛可靠性的要求可能要超過(guò)99.9999%。
實(shí)現(xiàn)固定場(chǎng)景的幾個(gè)英里的無(wú)人駕駛距離實(shí)現(xiàn)高級(jí)別無(wú)人駕駛還有漫長(zhǎng)的一段路要走，此外無(wú)人駕駛汽車從設(shè)計(jì)到生產(chǎn)的周期還需要額外的3到5年的時(shí)間，該行業(yè)的創(chuàng)業(yè)公司的周期會(huì)非常長(zhǎng)。不過(guò)值得一提的是，限定場(chǎng)景（比如高速公路）下的無(wú)人駕駛或者輔助駕駛依然很有意義。
（Vincent Vanhoucke）
Vincent Vanhoucke演講的最后一部分集中在機(jī)器人！他說(shuō)之前還沒(méi)進(jìn)入機(jī)器人領(lǐng)域時(shí)，看到DARPA挑戰(zhàn)賽中機(jī)器人的各種摔倒鏡頭會(huì)大笑，然后真正開(kāi)始接觸之后，就再也笑不出來(lái)了。機(jī)器學(xué)習(xí)的研究人員會(huì)想當(dāng)然地認(rèn)為機(jī)器人已經(jīng)大規(guī)模使用機(jī)器學(xué)習(xí)技術(shù)、想當(dāng)然地認(rèn)為機(jī)器人和環(huán)境狀態(tài)完全已知、想當(dāng)然地認(rèn)為樣本充足、想當(dāng)然地認(rèn)為計(jì)算機(jī)模擬十分逼近真實(shí)物理世界。從這個(gè)角度，機(jī)器人領(lǐng)域給機(jī)器學(xué)習(xí)提供了很多有意思的話題。
第一：如何協(xié)調(diào)感知和執(zhí)行是機(jī)器人的關(guān)鍵。
機(jī)器人的感知是軟件層面，而執(zhí)行則是機(jī)械層面。做算法的不懂機(jī)械，做機(jī)械的不懂軟件往往是業(yè)界共同面臨的問(wèn)題。
第二，如何提高樣本的有效使用再次成為核心問(wèn)題。
發(fā)生在物理世界的訓(xùn)練樣本往往獲取非常困難，以機(jī)器人手臂隨機(jī)抓取物體的實(shí)驗(yàn)為例，Google為了獲得訓(xùn)練樣本，只能以14臺(tái)機(jī)械臂在那里日夜不停地獲得訓(xùn)練數(shù)據(jù)。如何高效率的獲得樣本，或者是高效能的使用樣本，將是極其核心的問(wèn)題。
第三：機(jī)器人領(lǐng)域涉及強(qiáng)化學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、主動(dòng)學(xué)習(xí)。
對(duì)于機(jī)器人領(lǐng)域的核心技術(shù)強(qiáng)度學(xué)習(xí)，特別是深度強(qiáng)化學(xué)習(xí)(Deep Reinforce Learning)，幾乎所有我們拜訪的工程師，包括Vincent一致認(rèn)為技術(shù)實(shí)現(xiàn)的難度非常大。
第四：閉環(huán)控制系統(tǒng)對(duì)于改善性能極為必要。
第五：需要新的數(shù)據(jù)結(jié)構(gòu)，用于表示運(yùn)動(dòng)學(xué)鏈接（Kinematic chain）、圖像的卷積、運(yùn)動(dòng)軌跡。在之后的問(wèn)答環(huán)節(jié)，他對(duì)遷移學(xué)習(xí)抱有厚望。
老牌的IBM業(yè)務(wù)多元化、而且絕大部分是面向企業(yè)服務(wù)市場(chǎng)（to B）。因此，Michael Witbrock提出對(duì)于人工智能領(lǐng)域的研究路線更為系統(tǒng)、同時(shí)也更為傳統(tǒng)。
他提到對(duì)世界的大規(guī)模建模，由之前明確的、符號(hào)化的、分解的建模方式，逐漸融合隱形的、統(tǒng)計(jì)的建模方式。例如之前機(jī)器人動(dòng)力學(xué)方程中對(duì)于摩擦力這類非線性變量的建模和求解時(shí)，難度就不小。
IBM 強(qiáng)調(diào)了符號(hào)主義的重要性，認(rèn)為知識(shí)表達(dá)、邏輯在解決復(fù)雜問(wèn)題中非常重要。
基于邏輯的傳統(tǒng)知識(shí)表示值得引起我們的重新思考(Rethink)。
IBM在此方面的研究?jī)?yōu)勢(shì)是既有硬件，又有軟件。在整個(gè)IBM的研究人員Michael Witbrock演講中，他很自豪地介紹IBM過(guò)去在人工智能領(lǐng)域取得的進(jìn)展，并且已經(jīng)廣泛部署到多個(gè)領(lǐng)域，其中有一項(xiàng)是在人力資源領(lǐng)域的應(yīng)用。
對(duì)比一個(gè)國(guó)內(nèi)的案例，某乳品巨頭的人力資源負(fù)責(zé)人在談到人工智能在人力資源領(lǐng)域的應(yīng)用時(shí)不屑一顧地談到人力資源的工作富有人情味，冷冰冰的機(jī)器如何應(yīng)對(duì)。其實(shí)，LinkedIn的職位招聘不也是人力資源的一部分嗎？傳統(tǒng)行業(yè)如何面對(duì)高科技的進(jìn)步，被顛覆還是主動(dòng)整合，看似簡(jiǎn)單的答案要落到實(shí)地并不容易。
值得重視的是，隨著人工智能應(yīng)用入侵傳統(tǒng)行業(yè)，通常需要對(duì)控制對(duì)象所處的物理環(huán)境建模，這一塊是比互聯(lián)網(wǎng)更廣闊的天地，機(jī)會(huì)更多，當(dāng)然也更難。
發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用
從實(shí)現(xiàn)難度而言，發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用最容易發(fā)生，實(shí)際上推薦系統(tǒng)就是一個(gè)很好的例子，一方面大家對(duì)推薦商品的準(zhǔn)確性相對(duì)寬容。
發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用擠滿各種互聯(lián)網(wǎng)公司巨頭，創(chuàng)業(yè)公司在這個(gè)領(lǐng)域想有所作為也很難，或許還有垂直領(lǐng)域有些機(jī)會(huì)。而創(chuàng)業(yè)公司如何突破人才、數(shù)據(jù)、計(jì)算資源的局限，尋找生存空間值得進(jìn)一步探討。
代表Quora出場(chǎng)的Xavier Amatriain恰好就回答了這個(gè)問(wèn)題。Quora是家是中小型的創(chuàng)業(yè)公司，是美國(guó)的問(wèn)答網(wǎng)站（類似于國(guó)內(nèi)的知乎）。Quora只有85位技術(shù)工程師，其中僅僅兩位研究員。人才寥寥、計(jì)算存儲(chǔ)資源不多、數(shù)據(jù)也不是那么充足，
創(chuàng)業(yè)公司怎么能夠避免一些技術(shù)彎路，正確應(yīng)用人工智能技術(shù)呢？Xavier總結(jié)了他這么多年在機(jī)器學(xué)習(xí)實(shí)際工作的一些教訓(xùn)。
1. 更多的數(shù)據(jù)還是更好的算法？
Xavier認(rèn)為更好的算法更為重要；
對(duì)于小公司而言，本身數(shù)據(jù)量就少，而獲得標(biāo)記的數(shù)據(jù)更是需要額外的成本。小公司堆數(shù)據(jù)肯定是堆不過(guò)大公司，所以選擇把精力放在優(yōu)化算法上往往比選擇把精力放在獲取數(shù)據(jù)上更高效
當(dāng)然一方面小公司也需要不斷地積累數(shù)據(jù)。
2. 復(fù)雜模型還是簡(jiǎn)單模型？
Xavier認(rèn)為模型和特征選取需要匹配；
模型不是越復(fù)雜越好，在創(chuàng)業(yè)公司往往是不管黑貓白貓，能抓到老鼠就是好貓。根據(jù)界定的問(wèn)題，選取與特征相匹配的模型。
3. 什么情景下用監(jiān)督學(xué)習(xí)還是非監(jiān)督學(xué)習(xí)？
Xavier認(rèn)為非監(jiān)督學(xué)習(xí)可以降低維度、并對(duì)特征做工程突破。在某些情況下，將監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)結(jié)合，效果出奇的好；
4. 多種算法的組合還是單一算法？
Xavier提出應(yīng)該盡可能使用組合算法，不同于強(qiáng)調(diào)原創(chuàng)性的學(xué)術(shù)研究，創(chuàng)業(yè)公司更需要“拿來(lái)主義”，只要能用上，多嘗試不同的算法組合來(lái)提高準(zhǔn)確率是個(gè)明智的選擇。
5. 不要將一個(gè)模型的輸出作為另一系統(tǒng)的輸入
Xavier警告說(shuō)這會(huì)是系統(tǒng)設(shè)計(jì)的噩夢(mèng)。
發(fā)生在數(shù)字世界的關(guān)鍵性應(yīng)用和發(fā)生在物理世界的非關(guān)鍵性應(yīng)用
發(fā)生在數(shù)字世界的關(guān)鍵性應(yīng)用和發(fā)生在物理世界的非關(guān)鍵應(yīng)用對(duì)創(chuàng)業(yè)公司而言是機(jī)會(huì)比較多的領(lǐng)域。比如將人工智能用于金融領(lǐng)域和安全領(lǐng)域。又比如掃地或是玩具機(jī)器人是一個(gè)典型的發(fā)生在物理世界的非關(guān)鍵性應(yīng)用。這兩個(gè)領(lǐng)域是創(chuàng)業(yè)公司最有機(jī)會(huì)的。
人工智能顛覆性的理論突破仍需等待
通過(guò)神經(jīng)科學(xué)或是其他學(xué)科與計(jì)算科學(xué)交叉，尋找人工智能新理論的突破仍停留在理論研究階段。
雖然深度學(xué)習(xí)已經(jīng)獲得不少進(jìn)展，然而大家至今很多領(lǐng)域依舊是知其然而不知其所以然，而人工智能其實(shí)理論研究獲得的突破依舊。
（Gary Marcus）
對(duì)于現(xiàn)在基于概率和數(shù)理統(tǒng)計(jì)的深度學(xué)習(xí)而言，紐約大學(xué)神經(jīng)科學(xué)教授Gary Marcus希望從神經(jīng)生物學(xué)的角度尋找人工智能的突破。他剛剛加入新成立的Uber AI Lab。我們?cè)诖藬嗾氯×x地引用他的觀點(diǎn)，“目前對(duì)于人工智能最大的擔(dān)心是技術(shù)發(fā)展停滯不前”！這也是我們所擔(dān)心的。
在近幾年深度學(xué)習(xí)的浪潮中，人工智能領(lǐng)域的進(jìn)展更多是工程推進(jìn)，而不是理論突破，尤其是海量數(shù)據(jù)和超大規(guī)模的暴力計(jì)算。正如Peter Norvig曾經(jīng)談到Google在人工智能的出色表現(xiàn)時(shí)，就評(píng)論到“我們沒(méi)有更好的算法，我們僅僅是有更多的數(shù)據(jù)”。
而對(duì)于通用人工智能(Artificial General Intelligence)，Gary繼續(xù)批評(píng)過(guò)去幾十年徘徊不前?，F(xiàn)階段的智能不能像人一樣閱讀、理解、推理，無(wú)人駕駛的安全也不足以讓人信服……
人工智能研究的道路依舊任重道遠(yuǎn)!
0 條評(píng)論
人工智能離現(xiàn)實(shí)有多近？來(lái)看美國(guó)人工智能年會(huì)的最近進(jìn)展

發(fā)生在物理世界的關(guān)鍵性應(yīng)用

發(fā)生在數(shù)字世界的非關(guān)鍵性應(yīng)用

發(fā)生在數(shù)字世界的關(guān)鍵性應(yīng)用和發(fā)生在物理世界的非關(guān)鍵性應(yīng)用

人工智能顛覆性的理論突破仍需等待

人工智能離現(xiàn)實(shí)有多近？來(lái)看美國(guó)人工智能年會(huì)的最近進(jìn)展