人工智能的最后一公里
鄭磊/文
“機器會思考嗎?”人工智能之父艾倫·圖靈的這個問題已經部分得到解決,機器學習已經能夠在部分領域表現得像人類一樣會思考和行動,比如下棋。
目前,機器學習已經成為推動工業和社會發展的重要力量,可以實現從電子商務和廣告投放到教育和醫療等領域的自動化決策。基于計算機的圖像分析領域中的人臉識別是一個很好的例子。如果我們手里有大量醫療影像照片,就可以用這些照片訓練機器,讓它學會看新照片,推測是否存在某種疾病。機器學習還可以用于公司安保系統,判斷訪客是否是公司員工。但是機器學習也受到很多詬病,主要是這種學習方式必須基于大量數據,甚至可以說這種人工智能必須是建立在大數據基礎之上。而現實中,很多時候我們要解決的問題,只有少量樣本可供使用。這就是智能機器和人類的一個本質差別,人類學習不僅基于已有信息和知識,更會舉一反三,把一個模型適當修改之后用在另一個場合。這就是遷移學習,是傳統機器學習下一步需要掌握的能力。
在過去的十幾年里,不管是在算法、理論研究還是實際場景應用方面,遷移學習都得到了越來越廣泛的關注和研究。《遷移學習》這本書由該領域資深專家撰寫,系統全面,包括了遷移學習理論、自動遷移學習、小樣本學習、終身機器學習等,以及在計算機視覺、自然語言處理、推薦系統、生物信息學、行為識別等方面的成果。
嬰兒首先學習如何分辨自己的父母,然后利用這種分辨能力去學習如何分辨其他人。兒童可以僅從一些例子中學習,就能快速歸納出規律。這種從小數據中學習的能力,使得我們能夠利用和調整以前的經驗,來幫助解決新問題。在這種學習的適應能力上,人類目前遙遙領先于智能機器。我們經常遇到的是相互孤立、碎片化的少量數據,有時候由于很多限制,無法收集到大量數據,比如隱私保護。此時,機器學習就遭遇了難以克服的瓶頸問題。而遷移學習正是針對這一挑戰的一種解決方案,這種學習機制可以使人工智能系統更加可靠和穩定,也使它可以采用更復雜的模型來應對將會出現的變化。
通過遷移學習可以讓知識得到重復利用,從而使獲得的經驗可以被重復地應用到現實世界中。如果人工智能能夠有效運用遷移學習,我們就可以獲得會終身學習的智能機器。這和人類進化的軌跡有類似之處,人工智能科學家一直在向這個方向努力。研究人員一開始就將遷移知識的能力當作人工智能的主要基石。類比學習、基于案例的推理、知識重用和重建、 終身機器學習等,都屬于這個范疇。在教育和學習心理學領域,學習遷移一直是研究有效學習的一個重要課題,人們堅信,最好的教學能使學生學會“如何學習”,并使所學知識適應未來的情況。
我們舉一個簡單易懂的遷移學習的例子。世界上有兩種道路系統,分別是靠左和靠右行車。比如,美國和中國內地的駕駛員位置在汽車的左側,并且汽車要靠右行駛。而在英國、中國香港地區,駕駛位置是在汽車右側,并且汽車靠左行駛。我住在深圳,習慣靠右行駛,但是到了香港,就不敢開車了,駕駛習慣很難轉換過來。但是以后可以乘坐自動駕駛的汽車,而遷移學習就能夠用在這里,可以通過找出兩種駕駛中的共同特征,讓自動駕駛系統自如切換。我們可以看到,無論駕駛員坐在哪一邊,離道路中心線始終是最近的。這一事實能夠使駕駛員將駕駛習慣順利地從一個方向“遷移”到另一個方向。遷移學習的關鍵要素是尋找不同領域和任務之間的這類“不變性”。當然,實際的遷移學習要比這個任務復雜得多。
在遷移學習中,算法仍是最核心的技術,包括基于樣本、特征、模型和關系的算法。每一種遷移算法分別對應不同的知識遷移載體。文本挖掘是遷移學習算法的一個很好的應用場景,可以從文本中發現有用的結構性知識并將其應用于其他領域中。例如情感分類,在線論壇、博客、社交網絡等有大量用戶生成的內容,能夠從中總結消費者對產品和服務的看法非常重要,對于不同類型的產品、不同類型的在線網站、不同的行業,用戶可能使用不同的詞語表達他們具有相同情感的觀點。在這種情境下,就可以用遷移學習訓練出具有人類情感分類能力的機器。而當人工智能走完這最后一公里,可能就會讓很多人意識到它所帶來的嚴重威脅了。

2、本網其他來源作品,均轉載自其他媒體,目的在于傳遞更多信息,不表明證實其描述或贊同其觀點。文章內容僅供參考。
3、若因版權等問題需要與本網聯絡,請在30日內聯系我們,電話:0755-32905944,或者聯系電子郵件: 434489116@qq.com ,我們會在第一時間刪除。
4、在本網發表評論者責任自負。
網友評論僅供其表達個人看法,并不表明本網同意其觀點或證實其描述,發言請遵守相關規定。