人工智能的最后一公里
鄭磊/文
“機(jī)器會思考嗎?”人工智能之父艾倫·圖靈的這個問題已經(jīng)部分得到解決,機(jī)器學(xué)習(xí)已經(jīng)能夠在部分領(lǐng)域表現(xiàn)得像人類一樣會思考和行動,比如下棋。
目前,機(jī)器學(xué)習(xí)已經(jīng)成為推動工業(yè)和社會發(fā)展的重要力量,可以實(shí)現(xiàn)從電子商務(wù)和廣告投放到教育和醫(yī)療等領(lǐng)域的自動化決策。基于計算機(jī)的圖像分析領(lǐng)域中的人臉識別是一個很好的例子。如果我們手里有大量醫(yī)療影像照片,就可以用這些照片訓(xùn)練機(jī)器,讓它學(xué)會看新照片,推測是否存在某種疾病。機(jī)器學(xué)習(xí)還可以用于公司安保系統(tǒng),判斷訪客是否是公司員工。但是機(jī)器學(xué)習(xí)也受到很多詬病,主要是這種學(xué)習(xí)方式必須基于大量數(shù)據(jù),甚至可以說這種人工智能必須是建立在大數(shù)據(jù)基礎(chǔ)之上。而現(xiàn)實(shí)中,很多時候我們要解決的問題,只有少量樣本可供使用。這就是智能機(jī)器和人類的一個本質(zhì)差別,人類學(xué)習(xí)不僅基于已有信息和知識,更會舉一反三,把一個模型適當(dāng)修改之后用在另一個場合。這就是遷移學(xué)習(xí),是傳統(tǒng)機(jī)器學(xué)習(xí)下一步需要掌握的能力。
在過去的十幾年里,不管是在算法、理論研究還是實(shí)際場景應(yīng)用方面,遷移學(xué)習(xí)都得到了越來越廣泛的關(guān)注和研究。《遷移學(xué)習(xí)》這本書由該領(lǐng)域資深專家撰寫,系統(tǒng)全面,包括了遷移學(xué)習(xí)理論、自動遷移學(xué)習(xí)、小樣本學(xué)習(xí)、終身機(jī)器學(xué)習(xí)等,以及在計算機(jī)視覺、自然語言處理、推薦系統(tǒng)、生物信息學(xué)、行為識別等方面的成果。
嬰兒首先學(xué)習(xí)如何分辨自己的父母,然后利用這種分辨能力去學(xué)習(xí)如何分辨其他人。兒童可以僅從一些例子中學(xué)習(xí),就能快速歸納出規(guī)律。這種從小數(shù)據(jù)中學(xué)習(xí)的能力,使得我們能夠利用和調(diào)整以前的經(jīng)驗(yàn),來幫助解決新問題。在這種學(xué)習(xí)的適應(yīng)能力上,人類目前遙遙領(lǐng)先于智能機(jī)器。我們經(jīng)常遇到的是相互孤立、碎片化的少量數(shù)據(jù),有時候由于很多限制,無法收集到大量數(shù)據(jù),比如隱私保護(hù)。此時,機(jī)器學(xué)習(xí)就遭遇了難以克服的瓶頸問題。而遷移學(xué)習(xí)正是針對這一挑戰(zhàn)的一種解決方案,這種學(xué)習(xí)機(jī)制可以使人工智能系統(tǒng)更加可靠和穩(wěn)定,也使它可以采用更復(fù)雜的模型來應(yīng)對將會出現(xiàn)的變化。
通過遷移學(xué)習(xí)可以讓知識得到重復(fù)利用,從而使獲得的經(jīng)驗(yàn)可以被重復(fù)地應(yīng)用到現(xiàn)實(shí)世界中。如果人工智能能夠有效運(yùn)用遷移學(xué)習(xí),我們就可以獲得會終身學(xué)習(xí)的智能機(jī)器。這和人類進(jìn)化的軌跡有類似之處,人工智能科學(xué)家一直在向這個方向努力。研究人員一開始就將遷移知識的能力當(dāng)作人工智能的主要基石。類比學(xué)習(xí)、基于案例的推理、知識重用和重建、 終身機(jī)器學(xué)習(xí)等,都屬于這個范疇。在教育和學(xué)習(xí)心理學(xué)領(lǐng)域,學(xué)習(xí)遷移一直是研究有效學(xué)習(xí)的一個重要課題,人們堅信,最好的教學(xué)能使學(xué)生學(xué)會“如何學(xué)習(xí)”,并使所學(xué)知識適應(yīng)未來的情況。
我們舉一個簡單易懂的遷移學(xué)習(xí)的例子。世界上有兩種道路系統(tǒng),分別是靠左和靠右行車。比如,美國和中國內(nèi)地的駕駛員位置在汽車的左側(cè),并且汽車要靠右行駛。而在英國、中國香港地區(qū),駕駛位置是在汽車右側(cè),并且汽車靠左行駛。我住在深圳,習(xí)慣靠右行駛,但是到了香港,就不敢開車了,駕駛習(xí)慣很難轉(zhuǎn)換過來。但是以后可以乘坐自動駕駛的汽車,而遷移學(xué)習(xí)就能夠用在這里,可以通過找出兩種駕駛中的共同特征,讓自動駕駛系統(tǒng)自如切換。我們可以看到,無論駕駛員坐在哪一邊,離道路中心線始終是最近的。這一事實(shí)能夠使駕駛員將駕駛習(xí)慣順利地從一個方向“遷移”到另一個方向。遷移學(xué)習(xí)的關(guān)鍵要素是尋找不同領(lǐng)域和任務(wù)之間的這類“不變性”。當(dāng)然,實(shí)際的遷移學(xué)習(xí)要比這個任務(wù)復(fù)雜得多。
在遷移學(xué)習(xí)中,算法仍是最核心的技術(shù),包括基于樣本、特征、模型和關(guān)系的算法。每一種遷移算法分別對應(yīng)不同的知識遷移載體。文本挖掘是遷移學(xué)習(xí)算法的一個很好的應(yīng)用場景,可以從文本中發(fā)現(xiàn)有用的結(jié)構(gòu)性知識并將其應(yīng)用于其他領(lǐng)域中。例如情感分類,在線論壇、博客、社交網(wǎng)絡(luò)等有大量用戶生成的內(nèi)容,能夠從中總結(jié)消費(fèi)者對產(chǎn)品和服務(wù)的看法非常重要,對于不同類型的產(chǎn)品、不同類型的在線網(wǎng)站、不同的行業(yè),用戶可能使用不同的詞語表達(dá)他們具有相同情感的觀點(diǎn)。在這種情境下,就可以用遷移學(xué)習(xí)訓(xùn)練出具有人類情感分類能力的機(jī)器。而當(dāng)人工智能走完這最后一公里,可能就會讓很多人意識到它所帶來的嚴(yán)重威脅了。

2、本網(wǎng)其他來源作品,均轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,不表明證實(shí)其描述或贊同其觀點(diǎn)。文章內(nèi)容僅供參考。
3、若因版權(quán)等問題需要與本網(wǎng)聯(lián)絡(luò),請在30日內(nèi)聯(lián)系我們,電話:0755-32905944,或者聯(lián)系電子郵件: 434489116@qq.com ,我們會在第一時間刪除。
4、在本網(wǎng)發(fā)表評論者責(zé)任自負(fù)。
網(wǎng)友評論僅供其表達(dá)個人看法,并不表明本網(wǎng)同意其觀點(diǎn)或證實(shí)其描述,發(fā)言請遵守相關(guān)規(guī)定。