整理照片、分類小黃瓜… 人工智能在個人生活上的4大應用
原文刊於創新拿鐵Start Up Latte
AlphaGo 連續擊敗了幾位頂尖棋王後,我們忽然發現,電腦不單在重複性高的工作上做的比我們快,連需要大量思考的圍棋也可以打敗我們。AlphaGo 是如何辦到的?本文將為你介紹 AlphaGo 背後的機器學習系統 TensorFlow 以及我們可以如何運用。
本文的五大重點:1. TensorFlow 的進化,電腦現在能夠以更接近人類的方法學習。2. 不用整理,電腦也能夠為你找出「衝浪」與「滑雪」的照片。3. 電腦不但懂得分辨垃圾郵件,還會幫你回信。4. 只需要 3 天的訓練,電腦就可以幫你分類小黃瓜。5. 系統偵測管理員的車輛,延長居民可以停車時間。
1. TensorFlow 的進化,電腦現在能夠以更接近人類的方法學習
2015 年 11 月,Google 宣佈推出第二代的機器學習系統 TensorFlow 以取代第一代的 DistBelief。更重要的是,Google 決定以 Apache 2.0 授權模式開放 TensorFlow,讓有興趣的人都可以自由的使用它。
TensorFlow 是一套運用「深度學習」(Deep Learning) 的機器學習系統。有別於之前的機器學習,TensorFlow 能夠以更接近人類的方式學會新的知識。
人類透過聯想來學習的方法一直是機器無法模擬的。一個三歲的小孩,只要給他看幾張「狗」的照片,他很快的就能夠知道什麼是「狗」也能夠分辨「狗」和「貓」的不一樣。
但是,對機器來說,要知道什麼是「狗」就是很複雜的問題。以往的方法是為「狗」定義很多的「特點」,例如:四隻腳、 會吠、身體有毛、等等, 然後將這些「特點」輸入系統。但是,我們會發現就算我們定義的再細,機器還是無法有效的分辨出「狗」和「貓」。
「深度學習」改變了機器學習的方法。我們再也不需要定義任何的「特點」,我們要做的是提供大量的資訊給機器,以上面的例子來說,就是輸入大量的「狗」和「貓」的圖片。然後告訴機器,哪一張圖片是「狗」,哪一張是「貓」。而它就能夠自行定義出牠們不一樣的地方。當機器成功建立了這個「模型」後,它就能夠分辨任何一張圖片上的「狗」與「貓」。
2. 不用整理,電腦也能夠為你找出「衝浪」與「滑雪」的照片
如果你有在使用 Google 服務, TensorFlow 其實早就默默的處理你很多的需求。例如智慧型手機的出現,讓我們不自覺拍了很多的照片。這大量的照片是非常難整理的。試想在和朋友見面時,如果你要給他看看去年冬天滑雪的照片,或者是夏天在墾丁衝浪的英姿,搞不好就要找個十分鐘才能找到想要的照片。
Google 相簿就使用 TensorFlow 讓我們快速的使用關鍵字查詢未分類或沒有 Tag 的照片。因為 TensorFlow 已在網上透過分類與 Tag 學習到了各種關鍵字。因此,當你輸入「海」、「雪地」或「黃昏」,TensorFlow 就會找出對應的照片。
另外,當你需要翻譯時,你可以將要翻譯的文字拍下,然後將照片交給 Google 翻譯。Google 翻譯使用TensorFlow 分辨文字的能力,決定照片中什麼是可以翻譯的文字。讓你選擇哪個字需要翻譯。
3. 電腦不但懂得分辨垃圾郵件,還會幫你回信
Gmail 向來標榜它過濾垃圾郵件的能力。這也歸功於 TensorFlow 不停「學習」如何判斷垃圾郵件。
當我們收到一封「漏網」的垃圾郵件,我們可以使用 Gmail 的「回報垃圾郵件」功能。 TensorFlow 就會開始分析該郵件,並將它的「特點」記下。下次類似的郵件進入信箱時,就會被歸類成垃圾郵件。
同樣的,如果系統錯誤地將一些郵件歸類成垃圾郵件,你也可以使用「非垃圾郵件」功能,告訴TensorFlow 它搞錯了。由於 TensorFlow 不停的學習,目前,Gmail 已經可以判斷大約 99%的垃圾郵件。
Gmail 在 2016 年 3 月推出的 Smart Reply 功能,不但會閱讀郵件,而且還嘗試協助我們快速地回覆排山倒海的 Email,特別是在輸入不方便的手機上。
當你選擇了使用 Smart Reply,TensorFlow 就會開始為你的每封郵件,提出 3 個建議回覆。例如,當你收到一封朋友約你晚餐的郵件時,你就會看到有「好,我準時到」、「好,但是我會晚一點」、「對不起,我沒空」讓你選擇。在選擇後,你還是可以修改或增加內容。
為了確保使用者的隱私,Smart Reply 的開發人員不會看到任何郵件的內容。因此,所有的回覆都是通過TensorFlow 不斷學習的過程逐步加強改善。
根據 Google 在 Twitter 發佈的訊息,目前有 10% 來自行動裝置的回信都採用了 Smart Reply。下次你收到老闆快速的回信時,不要太開心,信可能是 TensorFlow 代寫的。由於 Smart Reply 目前只支援英文郵件,如果你的郵件不是用英文必須再等它支援其他語言才能使用。
4. 只需要 3 天的訓練,電腦就可以幫你分類小黃瓜
除了 Google 自家的服務使用 TensorFlow,很多人也使用它來解決各種不同的問題。日本的小池誠先生,見到自己務農的父母,每天都要花上好幾個小時的時間來為小黃瓜分類。他決定減輕父母工作,讓他們只需專注於種植出美味的小黃瓜。
日本對小黃瓜的分類並沒有統一標準,小池先生的父母會根據長短、粗細、顏色、紋理、是否有刮痕、是否彎曲、小刺多寡等規則,將小黃瓜分成 9 類。由於分類的方法相當複雜,一個人會需要累積好幾個月的經驗才能掌握這個技巧。因此,在農忙時他們無法請臨時工人來協助分類。
所以,小池先生決定要將這份工作交給機器。但是,市面上很難找到性能和價錢都適合小農場的分類器。當他看到 AlphaGo 在圍棋上的表現時,他決定使用相同的技術,嘗試自己建置一套小黃瓜分類系統。
這套系統為傳送帶上的小黃瓜拍照,然後 TensorFlow根據上傳的照片判斷小黃瓜的類別。判定後,通知「機器手臂」將小黃瓜推進標誌了不同類別的箱子裡。
為了讓系統熟悉分類小黃瓜的方法,小池先生花了三個月,拍了七千張小黃瓜的照片。再將照片和母親分類的結果都上傳到系統,做為學習的數據。
在系統完成學習後,他開始進行測試。測試時,系統分類的準確度高達 95%,但在真正使用的時候,準確度卻只有 70% 。小池先生認為這是由於學習資料不足而導致「過適」(Overfitting)(假設小黃瓜所有特徵的組合有 100 種,但是,在學習時只學到了其中 20 種組合。那麼,機器在執行時遇到其他 80 種組合時,就會嘗試將那它們套入已知的 20 種組合內。)。要解決這個問題,他需要增加系統的學習數據,讓系統能夠更精準的判斷各種細微的差別。
可是,由於「深度學習」需要大量的運算,小池先生所使用的 Windows PC 要很長的時間才能處理七千張照片。就算小池先生將照片的解析度降到非常低,系統仍需要 3 天的時間才能完成訓練。
而且,降低照片解析度的結果導致系統無法分辨顏色、紋理、刮痕和小刺。但提高照片解析度確又導致系統運算量暴增,效率變慢。因此,小池先生正打算使用 Google 的雲端機器學習平台(Cloud Machine Learning),期望能夠改善小黃瓜分類系統。
5. 系統偵測管理員的車輛,延長居民可以停車時間
在舊金山,由於車多位少,很多區域有兩小時的停車限制。居民們每兩小時就要將停在路邊的車移到一個街區之外,不然就會被開罰單。
一位名叫 John Naulty 的居民發現,其實他不需要每兩小時移車,只要在停車管理員第一次登記停車時間後的兩小時移車就好了。如果你早上 9:00 將車子停好,但是管理員一直到 9:30 才巡邏到你停車的地點,並紀錄停車的時間。你只要在 11:30 前將車移走就安全了。
為了有效的延長安全停車的時間,Naulty 在他的車內架設了一台相機和移動偵測機。在偵測到附近有任何的移動時,相機就會拍下照片,並將這些照片傳到執行 TensorFlow 的系統。
系統會分析照片中是否有拍到停車管理員專用的小車。當系統發現有75% 的機率,照片中有那台小車,系統就會發簡訊給 Naulty,提醒他在兩小時內要回去移車。
有了這樣的系統,Naulty 可以減少移動車輛的次數。雖然這是在鑽法律漏洞,但是,也不得不佩服 Naulty運用技術的能力。Naulty 為了「造福人群」,也將這套系統放到網上讓人免費下載。
2013 年,牛津大學對未來的職業做了一個詳細的研究。他們發現,每兩份職業就有一份極有可能被機器取代。而機器學習系統的成熟讓這個未來可能更快實現。
在這個趨勢下,日後很多例行工作,如售貨員、服務生等工作都會輕易的被機器取代。而專業工作如醫生、律師、會計師等,會因為有機器的協助,需求因此大量減少。
因此,我們需要重新思考我們的工作內容,並投資時間在學習系統無法取代的技能。要不然,某天踏入公司時,我們可能會發現自己已經被機器取代了。
譯者:戴羽,莫名其妙的進入了軟體工程,又莫名其妙的成為了專案經理。流浪多年,總算在寶島找到落腳之處。熱衷科技、歷史、電影、攝影。期望可以將自己所懂盡量回饋社會。
參考資料:
1. How a Japanese cucumber farmer is using deep learning and TensorFlow
2. Google’s New AI System Could Be ‘Machine Learning’ Breakthrough
3. Here’s What Developers Are Doing with Google’s AI Brain
4. Meter Maid Monitor’ aims to help SF users avoid parking tickets
5. THE FUTURE OF EMPLOYMENT: HOW SUSCEPTIBLE ARE JOBS TO COMPUTERISATION?
推薦閱讀:
1. 服務型機器人 Pepper 即將就職,月薪 26,888 元
3. 臉書發表可讀懂20種語言的人工智慧「DeepText」,稱「理解程度近乎人類」
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。