在9月底于英國倫敦舉行的深度學習高峰會(Deep Learning Summit)上,DeepMind (EETT編按:該公司現隸屬于Google母公司Alphabet)的研究科學家Ali Eslami介紹了一個非常有趣的項目,名為“人工智能與創造力”(Artificial Intelligence and Creativity)。
Eslami在DeepMind的團隊設置了一個AI代理(agent,一個會采取某種行動的神經網絡),以繪制人臉作為挑戰,在一臺計算機安裝繪圖程序(Mypaint),讓它能試驗各種變量,例如選擇筆刷、放置(placement)、線壓(line pressure)以及顏色等。該AI代理被饋入未標記的人臉照片訓練數據集,而結果是令人驚訝的逼真。
以未標記人臉照片訓練的AI代理所繪制出的人臉。
(來源:DeepMind)
Eslami的團隊是利用了強化學習(reinforcement learning)技術。今日大多數的AI系統是采用監督式學習(supervised learning),所饋入的數據是以某種方式標記過的,因此系統能將結果與標準答案進行比對;相反的,www.twshmhelmet.com,非監督式學習則是饋入未標記的訓練數據,讓系統嘗試以自己的方式去辨別特征。
強化學習就是某種形式的非監督式學習,在訓練過程中,有被稱為鑒別器(discriminator)的第二個AI代理對結果提供回饋,好讓負責創造的AI代理去學習。在產生影像的情境中,該鑒別器可能會比較產出的影像與訓練數據,然后針對是否能辨別出差異提供回饋,這種回饋可能是一種分數,以量化辨別所產生影像與訓練數據集之間差異的困難程度。
強化學習采用兩個AI代理,其一負責創造影像,另一個則嘗試分辨創造出的影像與實際數據之間像不像。
(來源:DeepMind)
在DeepMind教導其AI系統如何畫圖之前,庫卡機器人何服電機維修,他們已經教過該系統如何寫字──去年該AI系統一開始接受的訓練是各種英文字母的手寫字與字體的影像(采用MNIST與Omniglot數據集),而且系統非常成功地重現了那些字母。
DeepMind團隊還很驚訝地發現,若限制筆劃數,所產出的結果就很像是人類在匆忙中寫出的字跡,點與較小的特征會連在一起;該公司團隊還將算法與拿著畫筆的機器手臂聯機,以產生手寫書法。
一旦該AI系統能應付手寫字,Eslami的團隊就讓系統升級以應用更大的網絡,并采用更多CPU進行訓練。當采用人臉照片做為訓練數據集,AI系統繪制出的畫像會變得越來越逼真,如下圖所示的繪畫過程各個階段。
AI系統繪制人臉畫像的過程。
(來源:DeepMind)
請注意,該AI系統并沒有被提供目標影像,只是創造它認為看起來像人臉的畫像,機器人維修,而且計算機并沒有看過人類是如何繪圖,只是藉由強化學習的嘗試錯誤過程去探索關于繪畫的一切。Eslami表示,這里實際上有兩個復雜的任務,其一是以高精準度控制筆刷,其二是管理時間, 在過程中權衡其畫像結果要看起來有多逼真。
接下來該團隊所做的事情是自問:如果我們讓任務變得更困難呢?于是他們將筆劃的數量限制從1,000減少到20,而讓他們驚訝的是,該AI代理仍然能產生雖然更抽象、但看得出是人臉的畫像。
不同超參數(hyperparameters)下的不同AI代理所繪制的人臉“抽象畫”樣本。
而Eslami表示,那些抽象畫最讓人震驚的是,該AI代理已經能清楚辨識構成人臉特征的重點──即眼睛、鼻子與嘴巴;他們原本認為AI系統只能透過模仿或是以監督式學習被教導這些抽象畫,但強化學習確實也可能達成。
所以AI已經成功學會畫圖了..但這是一種創造力嗎?或者只是隨機結果?還有這能算是藝術嗎?你可能會爭辯,AI代理是利用創造力去嘗試以不同的方法呈現人臉,如上面圖片中的畫像,即使它們看起來都像人臉,其中的差異性還是比相似性更多。
不過事實是,AI系統的意圖并不在于將人臉抽象到繪畫的最基本元素中,也不是要產生能喚起情感反應的畫像,其目標是在于寫實,是以畫像看起來有多么逼真來評判其成功與否。
此外也會有人爭議,AI系統繪制的畫像是以高水平的技巧完成,所以這代表AI是有成就的藝術家了嗎?當訓練過程結束,該系統肯定能產出更好的畫像,甚至學著從模糊的筆觸開始,在最后添加更犀利的線條;可惜的是,今日對于何為藝術并沒有嚴格的定義,也許這個問題的答案應該由觀眾們來決定。
編譯:Judith Cheng