微軟研究院學者與中科院植物學家使用機器學習來開發花卉識別系統
你是否遇到過這種情況?外出與小孩散步,TA發現一朵很漂亮的花,跑過來問你是什么,但是你突然愣住了因為你并不知道它是什么花。
目前世界上至少存在250000種花,即便是經驗豐富的植物學者也很難全部認識它們。如果現在告訴你以后不用尷尬對小孩承認你并不知道它是什么花,不久之后你就能在無論什么時候都能馬上認出任何一種花卉或者任何植物的品種,會不會很期待?
鑒于目前圖像識別的強大能力以及使用智能手機隨手拍照的便利,普通人通過使用工具也能輕松的識別各種花卉。這個工具叫做智能花卉識別系統(SmartFlowerRecognitionSystem),說起來這個系統也是在微軟研究院學者與中國科學院植物研究所(InstituteofBotany,ChineseAcademyofSciences,KUKA機器人示教器維修,IBCAS)偶然促成的。
微軟亞洲研究院常務副院長芮勇在一次研討會上介紹了微軟的圖像識別技術,在場的中國科學院植物研究所的植物學家大為高興,因為之前他們付出了大量努力來收集區域花卉分布數據,但效果并不好。植物學家們馬上意識到微軟亞洲研究院(MSRA)的圖像識別技術在這方面擁有巨大的潛力,同時芮勇也發現他也找到用來提升圖像識別在解決真實問題方面的最佳試驗工具。
這項合作幫助中國科學院植物研究所加速累積了260萬的圖像數據,鑒于全世界任何人都能將任意花卉圖片上傳到這個數據庫中,且沒有人能對這個上傳進行監督分類,庫卡機器人,微軟亞洲研究院團隊必須創造一個算法來過濾掉不合格的圖片。但這還只是研究員JianlongFu和他的團隊建立這個能夠在許多不同種類的花卉中識別微小差異的工具中所面臨的第一個問題。
為了實現這個目標他們訓練了超過20層的卷積神經網絡,用來識別使用了一系列可以學習的過濾器的圖像。概括來說,它的工作方式是這樣的:
在向前傳導的過程中,每個過濾器對于輸入容量的寬度和高度來說都是卷曲的,且在過濾器和輸入中間計算點積。對于過濾器來說這樣產生了一個二維的激活圖,結果是神經網絡學會了在輸入區給定空間位置激活每一種特定特性種類的過濾器。
在輸入80萬張圖片到Caffe深度學習框架中后,微軟亞洲研究院(MSRA)的研究人員逐漸讓機器實現了在圖片識別上超過90%的的準確率,這個令人震驚的結果遠遠超過人類的識別正確率。
Caffe框架簡介:
Caffe由加州大學伯克利的PHD賈揚清開發,全稱ConvolutionalArchitectureforFastFeatureEmbedding,是一個清晰而高效的開源深度學習框架,目前由伯克利視覺學中心(BerkeleyVisionandLearningCenter,BVLC)進行維護。賈揚清曾就職于MSRA、NEC、GoogleBrain,他也是TensorFlow的作者之一,目前任職于FacebookFAIR實驗室。
同時這個計劃也大大幫助了中科院的植物學家們接近他們的目標,中科院植物所的ZhepingXu說到這個花卉識別系統不僅讓業內專家有效地掌握中國植物分布的情況,還幫助對花卉非常有興趣的普通人學到更多的知識。
一張圖片經過神經網絡層層分析之后,機器學習能夠識別出其為雛菊。
從目前公布的結果來看,智能花卉識別系統(SmartFlowerRecognitionSystem)的識別準確率還是非常不錯的。據微軟公布的消息,不久之后開發者將基于這個花卉識別系統開服出相關的應用,植物學家們能更加深入他們的研究,家長們在面臨孩子類似的問題前能不再尷尬,與此同時普通人也能更深入得欣賞花卉的美。
聽起來似乎很不錯,但是這個智能花卉識別系統(SmartFlowerRecognitionSystem)不免讓人想起之前微軟推出后火遍全球的how-old.net(測測你的年齡)。
How-old.net是微軟在Azure上用新發布的人臉識別APIs為2015年微軟開發者大會的展示搭建的,借助人臉識別API這個網站可以分析用戶上傳的照片中人物的性別和年齡。How-old.net它使用了包括機器學習在內的各種最新技術,具體實現過程如下:
檢測:檢測圖片中人臉的位置
圖像對準:確定一些關鍵的點的位置,比如眉毛、睛、子、角等,確定這些點之后可以確定人臉區域。
特征提。河辛藞D像區域之后,開始提取形狀、紋理、幾何信息是比較關鍵的特征。
訓練:有了大量特征數據以及對應的年齡數據,建立一個模型開始訓練。
估計年齡:新來一張圖片,獲取特征,根據訓練獲取的訓練參數,估計年齡。
How-old.net主要是靠三個技術來完成的,它們分別是人臉檢測、性別分類和年齡檢測。其中人臉檢測是其他兩個技術的基礎,而年齡檢測和性別檢測,它們只是在機器學習的過程中解決了分類的問題。這個涉及到人臉特征的畫像、收集可學習的數據,建立一個分類模型以及模型優化。How-old.net的人臉定位功能及性別識別功能大致準確,然而年齡預測結果并不是每次都準確,如下圖中加拿大流行歌手JustinBieber的實際年齡只有22歲(和選取的圖片也有部分關系)。
林志穎與郭德綱同齡,吳奇隆比他倆都大,庫卡機器人驅動器維修,但是測出來的結果卻是
使用機器學習的How-old.net雖然大部分測試結果都是準確的,但是也存在各種識別出錯的情況(也是How-old.net爆紅的因素之一)。號稱能達到90%的的準確率,同樣使用機器學習的智能花卉識別系統(SmartFlowerRecognitionSystem)是否會出現類似的錯誤,這也是不由得令人好奇。