深度|當監(jiān)控攝像頭有了AI大腦,是福還是禍?
我們通常會把監(jiān)控攝像頭想作是電子眼。對此,不同的人看法也大相徑庭,有人認為電子眼是在監(jiān)控我們,有人認為它在幫助我們密切注意環(huán)境。但實際上,它們更像是舷窗:當有人通過舷窗看時,它們才有用武之地。有時候這意味著人們會從磁盤錄像中查看現(xiàn)場畫面。但是大多數(shù)監(jiān)控攝像頭都是被動觀察者。它們只是用作震懾,或是在出現(xiàn)問題時提供線索。你的汽車被偷了?那就去查看閉路電視監(jiān)控吧。
不過這一情況正在發(fā)生改變且以一種很快的速度。人工智能為監(jiān)控攝像頭配備了數(shù)字大腦來匹配眼鏡,并讓其無需人力參與就可自行分析現(xiàn)場視頻。這對公共安全來說也許是好消息,它可以幫助警察以及第一目擊者更容易得發(fā)現(xiàn)犯罪或事故。此外,它還可以廣泛應用于科學和工業(yè)。但是這卻會嚴重侵犯未來的隱私并對社會公平帶來新的風險。
如果政府通過閉路電視能夠追蹤到大量人群,那會發(fā)生什么情況呢?如果警察在數(shù)據(jù)庫中僅僅通過上傳側(cè)面照片,就能以這種電子方式在城市里跟蹤你呢?如果在當?shù)刭徫镏行模瑪z像頭運行的是一個具有偏見的算法,它會因為不喜歡某一類型的年輕人就去通知警察嗎?
這些情況也許距離我們還很遙遠,但當下我們已經(jīng)發(fā)現(xiàn)人工智能結(jié)合監(jiān)控會帶來什么樣的后果了。ICRealtime就是一個例子。去年十二月發(fā)布的旗艦產(chǎn)品被稱作是閉路電視界的Google。有一個叫做Ella的應用及網(wǎng)頁平臺就是利用人工智能分析視頻中發(fā)生的事情并且使其提供及時搜索。Ella可以識別成千上萬種自然語言查詢,用戶可以搜索鏡頭從而找到呈現(xiàn)特定動物、穿著某種顏色衣物或是單個車型的片段。
在網(wǎng)頁演示中,ICRealtime的首席執(zhí)行官MattSailor向我們展現(xiàn)了Ella與大約40個攝像頭連接起來對一個公園實施監(jiān)控。他輸入了各式各樣的搜索內(nèi)容紅衣服的男士、UPS火車、警車幾秒鐘時間內(nèi),所有關鍵詞都得到了相關的影像片段。之后,通過限定時間和地理位置,他將搜索結(jié)果的范圍縮小了并展示了用戶可以如何表達贊成或是反對從而優(yōu)化結(jié)果就像Netflix一樣。
舉個例子,某地發(fā)生了一起搶劫,但你不知道實際情況到底如何。Sailor說道,但搶劫發(fā)生之后,有一輛Jeep牧馬人向東加速駛?cè)ァK晕覀兙洼斎?lsquo;Jeep牧馬人’,然后我們就可以獲得影像片段了。屏幕上開始出現(xiàn)片段,顯示出鏡頭前滑過的多輛Jeep牧馬人。Sailor表示這是人工智能和閉路電視結(jié)合的第一大優(yōu)勢:更容易去找到你要尋找的內(nèi)容。沒有這項技術,除了攝像頭,你什么都不知道。你需要連續(xù)數(shù)小時觀看影像從而進行篩選。他解釋道。
Ella在GoogleCloud上運行,它可以從幾乎任何一個閉路電視視頻系統(tǒng)中搜索鏡頭。Sailor表示:從單攝像頭系統(tǒng)例如保姆攝像頭或?qū)櫸飻z像頭到擁有成千上萬攝像頭的企業(yè)系統(tǒng),Ella都能適用。用戶每月支付費用,起價為大約7美元,總價會根據(jù)攝像頭數(shù)量的增加而增長。
ICRealtime的目標受眾是各種規(guī)模的企業(yè),但它也認為這一技術能夠吸引個人消費者。新興市場上,亞馬遜、Logitech、Netgear以及谷歌旗下的Nest智能家居已經(jīng)讓這些顧客開始廣泛使用安防攝像頭。但是Sailor表示這一技術要比ICRealtime簡陋得多。這些攝像頭連接到家庭WiFi上,通過應用程序提供實時視頻流。當它們發(fā)現(xiàn)有東西在移動的時候,它們就會自動記錄影像。但是Sailor表示它們無法區(qū)分闖入者和鳥類的區(qū)別,這就會導致很多誤報。這是非常基礎的技術,已經(jīng)存在很多年時間了。他說道,這不含人工智能,也不包括深度學習。
這種情況不會持續(xù)太長時間了。雖然ICRealtime提供的云分析工具可以升級現(xiàn)有傻瓜式的攝像頭,其他公司則是直接將人工智能嵌入在硬件里。BoulderAI就是這樣一家初創(chuàng)企業(yè),公司利用自己獨立的人工智能攝像頭推出視覺即服務。在設備中結(jié)合人工智能帶來的優(yōu)勢在于,它們無需互聯(lián)網(wǎng)連接就能工作。BoulderAI向各行各業(yè)出售產(chǎn)品,為每位客戶量身定制機器視覺系統(tǒng)。
這些應用已經(jīng)遍布各行各業(yè)了。創(chuàng)始人DarrenOdom在采訪中這樣說道,我們的平臺出售給了銀行業(yè)、能源業(yè)的公司。我們甚至有一個應用是去觀察披薩,決定它們的形狀和大小是否合適。
Odom還舉了一個在愛達荷州建造水壩的客戶例子。為了符合環(huán)保規(guī)定,他們正在監(jiān)控設施頂部的魚類數(shù)量。Odom表示:他們過去是安排了一個人坐在窗口看著魚梯,數(shù)有多少條鮭魚游過。(顧名思義,魚梯就是一條階梯式的航道,魚類可以借此向上游。)之后,他們轉(zhuǎn)而使用視頻技術,有人(遠程)進行監(jiān)控。最終,他們聯(lián)系到了Boulder公司,后者為其打造了一個定制化的人工智能閉路電視系統(tǒng),從而識別通過魚梯向上游的魚的種類。我們真的可以通過計算機視覺來識別魚的種類。我們現(xiàn)在能夠100%的識別愛達荷州的鮭魚。odom驕傲地說道。
如果ICRealtime代表的是市場的通用端,那么Boulder則呈現(xiàn)了精品承包商可以在這個市場上做些什么。這兩種情況下,這些公司現(xiàn)在提供的服務不過也只是冰山一角。就像機器學習在識別物體能力方面取得迅速進步一樣,它分析場景、活動和動作的能力也有望快速提升。一切準備工作都已經(jīng)完成,包括基礎研究、計算能力和訓練數(shù)據(jù)集這是創(chuàng)建出色人工智能的關鍵要素。視頻分析的兩個最大數(shù)據(jù)集來自YouTube和Facebook,兩家公司都希望人工智能幫助它們控制平臺上的內(nèi)容(不過兩家公司也都承認現(xiàn)在還沒有做好準備)。例如說,YouTube的數(shù)據(jù)集包含超過45萬小時帶標簽的視頻,公司希望這能夠激發(fā)視頻理解的創(chuàng)新和進步。參與構建此類數(shù)據(jù)集的機構有很多,這也讓我們對該領域的重要性有了一些了解。谷歌、麻省理工學院(MIT)、IBM和DeepMind都參與進來并創(chuàng)建了類似的項目。
ICRealtime已經(jīng)在致力于開發(fā)面部識別等高級工具了。之后,它想要分析屏幕上發(fā)生的情況。Sailor表示他已經(jīng)和教育行業(yè)的未來顧客進行過交談,對方希望當學生在學校遇到麻煩的時候,監(jiān)控能夠識別出來。比如說,他們對于發(fā)生打架的預先通知這一功能很感興趣。他說道。所有的系統(tǒng)都需要注意聚集在一起的學生,之后提醒某個人,他就可以查看視頻內(nèi)容來看看發(fā)生了什么或是親自去調(diào)查。
Boulder也在探索這類高級分析。公司正在開發(fā)的一個原型系統(tǒng)就是分析銀行內(nèi)人們的行為。我們專門尋找壞人,并且區(qū)分正常人的行為和越界者行為之間的區(qū)別。Odom說道。為了做到這一點,他們使用舊的安全攝像頭拍攝的影像來訓練系統(tǒng)來發(fā)現(xiàn)異常行為。但是這種視頻大多低質(zhì),因此他們也會找一些演員來拍攝訓練視頻片段。Odom沒有講述具體細節(jié),但表示這個系統(tǒng)會尋找特定的面部表情和行為。我們的演員會做一些類似蹲伏、推擠以及回頭撇的動作。他說道。