入坑機器學習,工業機器人維修,你首先得知道這十個知識點...
1.機器學習意味著從數據中學習,而AI呢是一個比較炫酷時髦的詞。
機器學習基于這樣的假設:我們可以通過將正確的數據放到正確的算法中去訓練解決一系列復雜的問題。當你需要融資或者發布產品的時候可以毫不猶豫的稱之為人工智能(AI),但是你心里需要明白現在AI是一個幾乎可以代表一切時髦用詞。
2.機器學習包括數據和算法,工業機器人維修,但最主要的部分還是數據。
機器學習算法特別是深度學習近年來取得了極大的成功,但是你需要明白的是數據才是使機器學習成為可能的關鍵因素。你可以使用簡單的算法實現機器學習,但是沒有好的數據你將寸步難行。
3.如果沒有大量的數據,那么你還是安心的使用簡單的模型吧。
機器學習的任務是從數據中訓練出一種模式,探索由參數定義的模型空間。如果你的參數空間太大的話,模型就會在訓練數據上出現過擬合,并使得模型失去泛化性。關于過擬合的詳細解釋需要很多的數學推到的,但是你需要記住的是,模型越簡單越好。
4.機器學習的能力只能到達訓練數據所能提供的水平。
無用輸入,無用輸出很好的反映了機器學習的局限性。機器學習只能在提供的訓練數據中發現模式,不能夠憑空學習出新模式。對于類似分類的監督學習任務來說你需要魯棒的收集正確標注的特征豐富的數據來作為訓練數據。
5.只要訓練數據具有代表性的情況下機器學習才會有效。
就像教課書中曾經教會我們的一樣過去的表現并不是未來結果的保障,機器學習只能在于訓練數據同分布的數據上有效。你需要對訓練數據和實際數據之間統計上的不對稱性保持足夠的警覺,同時需要保持模型不斷地被訓練讓它不落伍。
6.機器學習中最復雜的工作來自于數據轉換。
在閱讀文獻的時候你會看到很多眼花繚亂算法,你也許認為機器學習最主要的工作便是選擇算法和調節參數。但真實的情況是:機器學習中需要做的最多的工作就是數據清洗和特征工程,你需要將數據的原始特征轉換到能更好的表示其中信息的新特征上去。
7.深度學習是一項革命性的技術,但卻不是包治百病的靈丹妙藥。
近些年來深度學習被捧上神堂,遠遠超過了其他的機器學習算法。其中的原因之一就是深度學習可以自動完成傳統機器學習算法中需要特征工程才能實現的任務,特別是在圖像和聲音數據的處理中更是如此。但是我們需要明白深度學習不是萬金油,你只能在一定的范圍內應用這項技術,同時你也需要在數據清洗和變換上花上很多的精力才行。
8.機器學習極易受到誤操作的影響。
人類卻可能會自掘墳墓,當機器學習算法失效的時候,很少因為算法本身的的錯誤,而大多數情況下卻是人為的錯誤造成的。很多情況下你在訓練數據中不小心引入了認為錯誤,或者引入了偏差和其他的系統錯誤。你需要時刻保持懷疑的態度來使用機器學習算法,并在應用的過程中進行嚴格的檢查。
9.機器學習會在不經意間實現自我預言。
在很多機器學習的應用中,今天的決策會影響未來收集的訓練數據。一旦機器算法模型引入了一定的模型偏差,那么它會持續的收集新的數據不斷強化這一偏差。事實上有些這樣的偏差確實會奪取人寶貴的生命。每一個機器學習從業者都要在心中銘記:不要創造自我實現的預言!
10.AI不會擁有自我意識,也不會崛起摧毀人類的。
令人驚訝的是,在機器學習如此普遍的今天,庫卡機器人驅動器維修,好多人卻依舊用科幻小說和電影中的情節來定義和認識AI。的確,科幻小說可以啟發人的創造力,但卻不應該如此輕信科幻小說,以致于我們對真實的世界產生誤解。今天的世界已經有很多需要我們去關注的危險,從別有用心的邪惡的人到無辜的被濫用的機器。所以請大家不要再去擔心天網和超級人工智能的出現,而是應該用審慎的心態去看待機器學習,讓它更加健康的發展為人類服務。