正在閱讀
【演算藝術史——「機械創造」中的創新】與拉蒙.羅培茲.曼塔拉對談

【演算藝術史——「機械創造」中的創新】與拉蒙.羅培茲.曼塔拉對談

【Algorithmic Art History, Innovation in "Mechanical Creation"】A Conversation with Ramón López de Mántaras

機器沒有任何意圖、自我目標、心理狀態和情感,它只是一個由極其聰明的人設計製造的軟件。科學哲學家所謂的強人工智能(Stong AI)並不存在,也永遠不會存在。因為它需要具有心理狀態和情感意識,感受得到痛苦、挫折……。雖然人工智能可以非常複雜,但它不像人類那樣具有意圖,我們不應該將人工智能與人類智能混淆。

《典藏.今藝術&投資》(簡稱典藏):近年人工智慧演變迅速,隨著更新一代人工智慧的產生,是否也讓人工智慧的創造力隨之提升?又或是,因為基本思考模型沒有改變,其實只在於運算速度增快?

拉蒙.羅培茲.曼塔拉(Ramón López de Mántaras)(簡稱曼塔拉):近年來,計算創意在各領域取得了顯著進展,特別是在我比較熟悉的音樂領域,諸如人工智能可以即時伴奏樂手演奏,或與人類樂手一起表演,還能根據某個人或樂手的風格創作出符合其風格的新樂曲。在視覺藝術方面也有許多進展,很多生成式人工智能系統可以生成非常美觀的視覺藝術作品。但是,機器無法打破規則,提出全新的音樂風格、繪畫風格或其他藝術活動方面的全新想法。因為機器是基於已經存在的東西進行學習,它們可以生成遵循相同規則和模式的圖像、音樂或其他作品。然而,創造立體派或新的音樂風格等,是通過打破傳統規則實現的。立體派打破了三維空間只有一個消失點的傳統規則,無調性音樂也讓音符不直接遵循傳統,而是以全新的規範或打破一些既有規則來創造全新的音樂風格。

從古典到現代,音樂的創新和挑戰是非常困難的,因為它需要高度的創意。在我看來,這種高度的創造力只有人類才能達到。巴赫(J.S. Bach)被認為是最重要的音樂創新者之一,而爵士樂也有許多不同類型風格,從新奧爾良到波普樂(Bebop)、酷派(Cool)、自由爵士(Free Jazz)等。人工智能可以生成原創作品,這不等於抄襲,因為它還是可以創作出此前不存在的音樂或畫作,但它的根源和之前的作品相同,沒有打破任何規則。此外,機器沒有任何意圖、自我目標、心理狀態和情感,它只是一個由極其聰明的人設計製造的軟件。科學哲學家所謂的強人工智能(Stong AI)並不存在,也永遠不會存在。因為它需要具有心理狀態和情感意識,感受得到痛苦、挫折……。雖然人工智能可以非常複雜,但它不像人類那樣具有意圖,我們不應該將人工智能與人類智能混淆。

所有這些系統,我們應該將其視為助手或協助系統,幫助我們提升創造力。我的一些作曲家朋友告訴我,他們從人工智慧系統中獲得靈感。它會創造出很多糟糕的東西,但有時會有某些有趣的小片段,於是他們擷取這些片段進一步發揮創意。這就像靈感一樣。同樣地,有的編舞家從頭像擷取的形象中創造出新的舞蹈動作。這些系統只是一個工具,其生成的結果仍需要由有藝術感和藝術經驗的藝術家進行編輯和改進。此外,這些系統其實並不容易使用,需要有一個非常好的設計提示才能得到真正好的東西。因此,我相信這些系統只是工具,可以幫助一個人像藝術家一樣,但不會取代一個藝術家。雖然我不知道50年後會發生什麼,但在中、長期的5到15年內,我相信這些系統只是藝術家的高級工具,可以幫助他們提高創造力,而不是取代他們。

典藏:也就是說,「未知的未知」(Unknow unknowns)是AI最大的侷限。

曼塔拉:沒錯。人工智能的一個明顯限制是它沒有通用知識和心理狀態,無法發現新知識和讓未知變得已知。它完全依賴現有的事物,如圖像、文字和設計,進行聰明的組合,但是對於生成全新的事物,它就不是很擅長了。人工智能不擅長轉換,轉換意味著擴大既有概念空間以尋求更多可能的想法,而這需要打破現有的規則,但人工智能並不會創造新的規則,它們沒有意圖,也不會隨機嘗試新事物。即使是隨機的組合,也會與現有的東西相關聯,產生的新事物仍然會遵循現有的風格與規則。因此,我強調人工智能無法創造新風格。

典藏:現今許多人利用AI製作作品,但我們看到的多半具有某種「潮流」或「時尚」狀態,這在生成藝術中更為明顯。在您長期研究的歷程中,您認為有所謂AI創作的「經典」嗎?就像我們認為《侍女》(Las Meninas)或《格爾尼卡》(Guernica)是經典一樣。

曼塔拉:我不認為AI能做到。像《侍女》或《格爾尼卡》這樣的創作是一些天才人物所做,他們依照自己制定的規則創作作品,《格爾尼卡》就是其一。《格爾尼卡》是因西班牙內戰而做,當人們被迫離開城市、失去家園,這幅畫非常貼切地反映了這些經歷與感受。畫家以其所創造的規則去表達這個歷史事件,而他的解讀非常了不起,於是創造了一幅令人難以置信的畫作。當一些悲劇發生時,AI無法像人類一樣因為任何可怕的政治事件而獲得靈感,並說:「這啟發了我!」AI不能像人類一樣感受情感,它不能像人類一樣透過這些事件創作畫作。我對於AI是否能夠創造出這樣的畫作充滿疑慮。

我不會說西蒙.科爾頓(Simon Colton)的繪畫作品為「完整」。他開發了一個軟體,能將文字或新聞與畫作相結合,生成相關的畫作。但畫作的解讀始終需要人來進行。你需要人類寫下適當的文字或提示,這樣才能生成適當的畫作。但人工智慧沒有感情和情感,所以它無法直接產生這些。人工智慧的創造力和問題解決能力與人類的不同。機器和人類具有不同的能力,此外機器沒有做事的原因、沒有目標。因此,我們應該清楚地分辨機器和人類的區別,並且不應過度人性化機器。

委拉斯奎茲(Diego Velázquez)|侍女 油彩、畫布 318×276cm 1656 ©Wikipedia

典藏:那您是否曾經看過一些令您覺得印象深刻,以AI協助的創作呢?

曼塔拉:在巴塞隆那有位作曲家Ferran Cruixent,他一直在嘗試使用人工智慧進行創作實驗。他告訴我,即使AI創作系統創作出的東西非常糟糕,他仍然會仔細觀察樂譜,從中得到創作靈感,並利用AI生成樂譜中一些可利用元素來進行創作。另外還有一位非常出色的鋼琴家和爵士樂手Marco Mezquida,他也利用AI系統來增強自己的創造力和藝術表現力。這些都是很明顯的例子,AI可以很好地擴展你的能力、創造力和藝術表現,還有很多其他國家也在進行類似的研究,讓鋼琴家和AI系統對話,從而創作出美麗的音樂。這些都是人工智慧在創意領域中非常好的應用,它們與人類一起合作,這是最有趣的地方,也是最值得關注的地方。我認為這種團隊合作的核心,是未來的發展方向。

典藏:也因此您認為AI的創作會帶來新的美學思考嗎?

曼塔拉:或許。這些只是我提供的幾個例子,但它們並沒有任何意圖或目的,也沒有持續創作或傳遞創意的意圖。儘管有個軟體在運行,但還是要憑藉一個具有智慧和藝術感知力的人,可以從某個音樂片段、畫面、圖像中去挑選、提取,進而產生新的靈感、創作。AI可以提供人類想法,但這往往是偶然的,並非AI有主動幫助的目標或企圖。機器一無所知,它不知道它在演奏,也不知道它正在生成圖像。我們不會變得毫無價值,AI只是一個由聰明人編碼的複雜軟體,智慧和創造力在人類這邊,是人類創建了這個軟體,並且使用它來提高自己的創造力。在我看來,就是這麼簡單的事情。

典藏:對於平庸的藝術家而言也是嗎?

曼塔拉:我認為是的,它也可以有幫助。當然,如果你是一位非常優秀的藝術家,你會更好地利用它。如果你想要達到非常高的創造力水平,相較於一個普通藝術家,你可以從中受益更多。也許一位普通藝術家會忽略掉一些可能很有趣的東西,而一位頂尖的藝術家可能會發現一些普通藝術家看不到的點子,這可以成為更好的作品的好起點。但這不是一定的,對一般人也可以有所幫助。

典藏:這讓我想到AI和人類對弈的問題。有些西洋棋棋手透過與AI對弈,因而創造了新的策略與步法。如果我們用AI來教育年輕的一代,應當會對我們的生活產生很大的改變?

曼塔拉:確實有可能。西洋棋選手是一個很好的例子。在50年前或40年前,想要在14、15歲時成為國際西洋棋特級大師是不可能的,因為這需要多年的訓練、升級、學習與鑽研棋局等等。但現在我們有許多極為年輕便成為國際西洋棋特級大師的選手,因為透過AI系統和電腦,這些年輕人能更快地獲得資源、更快地達到特級大師的水準,我確信這歸功於電腦與電腦棋類。這是一個很好的正面效益例子。然而,我們也必須考慮這些最新的深度學習西洋棋手,是基於所謂的黑盒(black box),也就是你無法知道、無法追蹤、沒有推理線索,只能檢測、識別模式然後做出決定,但卻無法解釋這些決定。即使在這些西洋棋產品中有許多隱含的新知識,但這些隱含在非常複雜的深度神經網絡中的新知識並不容易被捕捉,或者可能存在可以被提取的隱藏知識。這看起來很矛盾,它雖然是一個好東西,但卻是不可理解的。最近基於深度學習來玩棋類遊戲的機器能做到很多好處,但我們無法知道它們做出一個決定的原因。當1997年電腦深藍打贏國際西洋棋冠軍時,它的工作原理是透明的,你可以看到規則,可以遵循所謂的搜尋演算法(search algorithm)知道它在做什麼,因此對於國際象棋高手來說他們更容易利用它來學習、制定策略。但是現在的西洋棋軟體是個黑盒子,你看不到裡面發生了什麼,實際上,裡面有數百萬個數字正在改變,神經元之間的連接和權重都在變化,但這並不能作為解釋,你無法知道測試機或測試軟體為何會做出這一步而不是另一步,這是難以理解的。因此,由於這個黑盒子的存在,這是一個問題。

經電腦深度學習,電腦也可以下西洋棋。圖為2019年維克安澤西洋棋超級大賽現場。(©Wikipedia)

典藏:關於人工智能測試,現今的測試都奠基在圖靈測試,是否有更適合的測試,或是我們應該發展新的測試方法,才足以認識所謂的「智能」?

曼塔拉:是的,圖靈測試非常有限。如果只是看背後是機器還是人,機器其實可以輕易愚弄人類。ChatGPT就是一例,很多人與ChatGPT互動時,他們可能會認為他們在與人類互動,但實際上在螢幕後面是一個軟體。這並不能證明智能。因此,ChatGPT不是智能的,我的意思是,不是以人類智慧的意義來說,那是完全不同的一回事。但是有一些新的測試正在被提出。其中之一是完整圖靈測試,它僅涉及文本,但不僅通過鍵盤進行問題測試和通訊,還需要機器做許多其他事情,不僅是回答問題,還需要執行動作。想像一下,你在廚房裡放了一個人形機器人,它必須完成一些任務。例如,它必須洗碗或者完成其他室內環境中的任務,觀察它的表現,看它是否有能力這樣做。這是圖靈測試的擴展,不僅涉及問答,還要在現實世界中進行動作,移動、觀察事物,並告訴你一些信息,解釋這些信息的含義。

想像這樣一種情境:你向系統展示一個城市中的路口,然後期望系統能夠說出:「現在有紅燈、行人和樹木。」紅燈亮起時車子必須停下來,綠燈是用來指示行人過馬路的。當綠燈亮起時,我知道這輛車不能左轉,因為那邊禁止左轉。當下雨時,能見度不佳,因此你必須緩慢駕駛。這是把一個機器放在現實環境中,讓機器解釋它看到的世界並提出詮釋,這比圖靈測試複雜得多。因為這需要常識性知識,需要系統對這世界物體產生的方式以及物體如何運作等方面有一般性知識,才能給出合理的解釋。又比如,一個靜止不動的球放在桌子上,然後另一個球來踢這個球,這個球移動了。你必須告訴系統:解釋一下發生了什麼事情。系統必須知道一個物體如果沒有外力作用,它就不會移動,所以它必須知道牛頓定律,並且理解這些定律在物理世界中的應用。你可以向系統展示一個球靜止不動,另一個球接近後會發生什麼事情的影片。系統必須能夠說出,那個移動的球會踢起不動的球,不動的球就會開始移動。對於人類來說,這些都是顯而易見的,但對於機器來說就不一樣了,因為它需要知道關於世界和物體行為的知識,從非常簡單的基礎物理知識到更深入的理論都需要。完整的理論測試涉及對人工智能進行所有這些測試,我們不知道有沒有機器可以通過這些測試。

還有另一個稱為Winograd測試,這個測試的目的是要找出機器是否具有常識性的知識。你可以告訴機器「The trophy didn’t fit in the box, because it was too big.(獎杯無法放進盒子裡,因為太大。)」或是「The trophy didn’t fit in the box, because it was too small.(獎杯無法放進盒子裡,因為太小。」在兩種情況下,系統都必須回答是哪個因素導致無法放進去。在第一種情況下,獎杯太大,所以無法放進去;而在第二種情況下,盒子太小,所以無法放進去。有很多類似的問題,只需改變一個關鍵字,例如「大」或「小」,系統每次都要能夠正確回答。這只是一個例子,在Google上可以找到很多類似的問題。

Winograd測試被認為是評估人工智慧進展更好的標準測試。假設今天有一個系統能正確回答20%的問題,而五年後有一個AI能正確回答100%,那麼進步是明顯的。進行測試的興趣不在於娛樂,而是監測、評估人工智慧的進展。就像在科學實驗中,當你進行一個試驗或測試時,是因為你想要測量某些東西一樣。而在人工智慧的情況下,我們想要測量的是將常識知識賦予機器這個未解決的問題。因此,等待一個擁有相當常識的機器是一個未解決的問題。但這就是為什麼我們要測試完整的圖靈測試,以便量測進展方向,達成擁有具備常識的機器的目標。

ChatGPT對於自身定義的回覆。(截取自ChatGPT網站)

典藏:您又怎麼觀察愛達測試的可能性?

曼塔拉:我在各種國際論壇中並沒有聽到對艾達測試的討論,它提出的概念在於這台機器需要能夠寫出虛構故事、創作詩歌或編寫畫作等,如果是這樣,通過GPT或GPT-3、GPT-4,它們確實可以寫虛構故事,儘管如我們之前所說,它們無法創造,它們只是將現有的故事和詩歌結合到系統中。但我沒有看到測試的詳細內容,它測試的條件是什麼?應該在什麼條件下進行測試?測試內容是指我們能否寫出虛構故事、描述或是其他東西?有些機器可以用來測試內容,例如我們必須評估多少人類干預是必要的,如果沒有人類的介入,這是不可能的。你需要有人寫出合適的提示詞,才能得到好的結果,它可能很和諧,但卻不是嚴格定義的藝術與創作。你可以以一句話讓ChatGPT發展成一個段落,但它無法因此寫一部長達數百頁的小說。我們應該看看這個測試的要求,數百頁的小說是做不到的,但ChatGPT確實可以做到一、兩頁的篇幅。我想最終還是取決於測試的具體條件。我從未見過關於愛達測試任何精確的測試要求或條件定義,我懷疑是否有這樣的測試設計。如果測試設計良好,我不確定是否有機器已經通過了這個測試。

採訪整理|朱貽安( 4篇 )

大學學習西班牙文,後修讀中國藝術史,有感於前生應流有鬥牛士的血液,遂復研習拉丁美洲現代藝術。誤打誤撞進入藝術市場,從事當代藝術編輯工作。現為《典藏.今藝術&投資》企劃主編。