正在閱讀
人工智慧作為一種踰越/愉悅─論AI詠唱者的合成欲望與匱乏追求

人工智慧作為一種踰越/愉悅─論AI詠唱者的合成欲望與匱乏追求

AI as a Way to Exceed and Elate ——On the Synthesized Desire and Deficient Pursuit of AI Proponents

本文以近日 AI 工具創造無數合成網美作為開場,側寫「AI 網美」背後開源互助的創作生態系,並梳理生成式人工智慧(Generatvie AI)在圖像領域的發展,最後嘗試討論單極擬真與多元價值之間的衝突。虛擬作為真實的潛在,重新打開我們對於真實世界的認知。

當真實的身體只剩下一些標準值,值得提問的反而是,誰模仿了誰:是虛擬真實,或者「如假包換」的真實呢?

——《虛擬真實:我們的身體在或不在?》

量產小模 — 手工業與自動機

最近網路上流傳一份現象級Google問卷《AI真人辨識測驗》,總共二十題,試問圖中的「美女」是真人還是AI(Artificial Intelligence,人工智慧),真人來源為推特網美圖,假人為合成圖片,由開源工具Stable Diffusion所製作。截至2月28日,共有將近26萬人作答,滿分20分,中位數得分為10分。這意味著26萬名作答者的集體心智竟真假不分,與翻硬幣瞎猜差不多。且分數並非常態分佈,而是「鐘型曲線」稍稍左移,意即平均數以下標準差較窄,作答者分佈較密集,作答者可能誤認使用修圖工具的「真人」是「假人」,而不存在的「假人」比「真人」更真實。(註1)

本文作者以提示字(Prompt,或咒語)在Stable Diffusion環境中使用ChilloutMix、LoRA: japaneseDollLikeness、LoRA: taiwanDollLikeness等模型混製出來的相片。(黃豆泥提供)

這已經不是第一次AI在「審美」之領域蔚為話題,數位藝術家早已如同靈媒處理多年。德國數位藝術家馬里奧.克林格曼(Mario Klingemann)於2018年獲得流明獎(Lumen Prize),其作品《屠夫之子》(The Buthcer’s Son, 2017)便是使用生成式對抗網絡技術(Generative Adversarial Network, GAN)製作。而林茲電子藝術獎(Prix Ars Electronica)於2019年開始也設立「人工智慧」與「生命藝術」(Artificial intelligence & Life Art)類別。但比起遠方驚雷,《AI真人辨識測驗》刻意強調網美修圖鑿鑿與AI清麗無痕,凸顯台灣大眾審美的曖昧與欺瞞。

馬里奧.克林格曼(Mario Klingemann)的《屠夫之子》(The Buthcer’s Son, 2017)

我們早已活在過度修飾的數位環境裡。合成圖片是一面鏡子,反應網路世界的真實。技術為欲望而演進,人類為技術繁殖而授粉。修圖技術演進史得益於個人裝置運算速度革新,從電腦軟體Photoshop到手機應用程式「美圖秀秀」,再到封裝的人工智慧修圖引擎,現已踏入無需真實演員的量產世界。任何人只要擁有一台堪用的電腦,彈指之間(數秒鐘)便可以製造出能夠獲取數萬點擊的小模合成相片。這是因為合成圖片的資料集,來自於世界集體。這次的《AI真人辨識測驗》的AI網美,皆來自開源AI模型Stable Diffusion,該模型已事先訓練近60億帶有標題的圖片與標籤化(Labelling)。此外針對不同需求,今年以來網路上已出現網友無償貢獻的專門模型。你甚至可以訓練機器產生自己的或朋友的臉龐模型。

1966年,幾乎是史上第一代的數位藝術家麥克.諾爾(Michael Noll)做過一個類似的實驗,他以IBM 7090電腦模仿蒙德里安(Piet Cornelies Mondrian)的作品《線條的構成》(Composition with Lines, 1917),製作《線條的電腦構成》(Computer Composition with Lines, 1964),並將兩件作品問一百名受試者哪件是真貨,只有28名猜對,此外有59名受試者更喜歡電腦生成的作品(註2)。不論哪個時代的受測者都很可憐,被刻意欺瞞。列夫.曼諾維奇(Lev manovich)稱1966年諾爾的研究為藝術圖靈測試的雛形,並進一步提問,若我們需要人工智慧挑戰藝術,它應該模仿哪一個時代的藝術家,還是未來時代?現今具有量化的「藝術」評判標準嗎?

《線條的電腦構成》(Computer Composition with Lines, 1964)

但凡修圖的血汗結晶,都被演算法給抄走了。網路世代苦苦追求的完美化身,如今被人類的造物打造出來。事實上,不論是使用濾鏡修圖的真人,還是使用擴散模型(Diffusion Model)製作出來的帥哥、美女,都有使用人工智慧工具的痕跡。新媒體藝術學者曼諾維奇認為創造力與美學將成為人工智慧技術的最終試驗場,這是因為這個複雜的領域足見人類能力的巔峰。媒體理論先驅麥克魯漢說媒體是人類感官的延伸,曼諾維奇補充,人工智慧是人類與世界之間協調的延伸能力。人工智慧如今已入侵日常生活,如手機相機元件的增強引擎,或社交軟體的自動修正功能。根據曼諾維奇的描述,每天數以億次的機器與人類都會通過諾爾的藝術圖靈測試,因為人工智慧的造物更美。(註3)

希臘神話中的賽普勒斯國王畢馬龍(Pygmalion)是一名雕塑家,他雕出了一尊想像中完美的女性雕像,並且愛上了它,還給它起了個名字「伽拉忒亞」,後來愛神阿佛洛狄忒給了它生命,最後畢馬龍與它結為連理。曼諾維奇認為當我們與沒有靈魂的機器對話(或下咒語,Prompt)時,能從「模擬」到「真實」之間創造出滿足感。只要投入真實的情感,無論創作過程是由人還是機器製作,投射之物是虛擬角色還是真人,都無所謂。

本文作者以伽拉忒亞(Galatea)作為提示字(Prompt,或咒語)在Stable Diffusion環境中使用ChilloutMix、LoRA:koreanDollLikeness等模型混製出來的相片。(黃豆泥提供)

情色造物 — 可控的創世私體驗

這兩年圖像類的人工智慧工具進展速度驚人,「人類要滅亡了」的言論反覆出現。滅亡論者有兩種脈絡,工作的剝奪與(開玩笑式地)伴侶的剝奪。前者為創作者焦慮於插畫、設計提案、快速製圖等文化創意產業(Creative Industry)即將被顛覆,低技術門檻的創作過程被自動化工具取代,如同19世紀英國盧德主義者(Luddite),抗議工業時代紡織機器取代工人起義造反。事實上,國際上已經出現手機遊戲插畫、童書插畫、甚至美女詐騙業者使用AI工具快速製圖的案例;而後者是各式社交平台的玩笑話,性別刻板印象具體而微地展現在網路公共空間,直男討論:「如果AI女友這麼正,為何還需要真人伴侶?」(男生多討論視覺層面的人工智慧);生理女性分享:「如果AI男友如此貼心,為何還要找真人交往?」(詳見「在場非虛構獎學金」2022年得獎作品《我的AI男友-真實或虛妄的愛》,側寫AI交友軟體Replika使用者群像)。

以上不論是視覺繪圖還是文字陪伴,人工智慧輔助科技讓使用者不再只是「觀看者」,而凌駕至「創造者」的角色。在繪圖工具,使用者可以使用提示字(Prompt Engineering)投射出念想的伴侶化身(或自己);在對話工具,使用者一來一往的對話之中產生滿足。喬治.巴塔耶(Georges Bataille)的《情色論》(L’Erotisme)認為慾望的本質在於踰越(transgression),禁忌必須恆常存在,才能越界。「性」的本質在於好奇跟創造的慾望,而AI生成的敏感內容(Sensitive Content)便是非常合適的踰越載體,AI的黑盒子是一種潘朵拉的盒子,裡頭僅存希望。

個人化AI工具的出現,控制即體驗,出乎意料為驚喜,此時與AI互動,或為麥克魯漢筆下的冷媒體(Cold Medium)。如果觀看網美相片或閱讀言情小說是熱媒體,那參與AI帥哥美女繪圖或AI文字伴遊便是冷媒體。冷媒體需要使用者高度參與,需要主動貢獻想像力。

想像力(提示字或咒語,Prompt)與種子碼(Seed),創造出永不重複的俊男美女群像(這一次,多元性別的科技發展速度並沒有落後異男太多,雖然資料集的大小仍然差很多)。在數位邏輯的世界中,出現預期外的結果往往被視為臭蟲(bug)。這一次我們脫離工業時代習慣的路徑依賴,強調標準化、規格化的時代或許已被鬆動。AI工具的隨機性,讓意料之外,情理之中,成為欲望投射的化身。

在生成藝術(Generative Art)領域,數位收藏品世界(尤其是NFT加密藝術收藏平台)強調可控的隨機性(Controlled Randomness)。藝術家創造體系,收藏者參與鑄造(Mint)。藝術家編寫程式碼,創造風格統一的作品系列,多版次,但每一件作品皆各有不同。2022年流明獎(Lumen Prize)NFT類別首獎《儀式—威尼斯》(Rituals – Venice, 2022),由Aaron Penne與Boreta兩位藝術家合作之音像藝術作品,便是以人工合成創造永恆變幻的冥想體驗,與即時鑄造(Live Mint)整合在一起。

2022年流明獎(Lumen Prize)NFT類別首獎:Aaron Penne與Boreta的《儀式—威尼斯》(Rituals – Venice, 2022)。

事實上,以AI作為創作工具早已被視為生成藝術(Generative AI)的一支,且被置入長式生成藝術(Long-form Generative Art)的類別中。上一段討論的「體驗/鑄造」形式為短式(Short-form)生成藝術,意即隨機賦予參與者一件作品,參與者無需額外做任何事。長式生成藝術使創作者與參與者皆需要耗費更多精神完成一件作品,為作品創造精選(Selective)、集體(Collective)、共識(Consensus)的結果。在此脈絡下,AI繪圖做為一種長式生成過程,在種子碼與使用者念咒(Prompt)與揀選的過程中,成為目標明確的創作過程。(註4)

竊國者侯 — 巨人的肩膀不給站也能站

站在巨人的肩膀上,科學理論得以接力發展,AI技術尤其如此。尤其是演算法、資料集、創作成果彼此之間的可互通性(interopertability),將技術迭代的效率提升一個數量級,但此刻不一定有徵得巨人的同意。

2022年10月,NovelAI推出圖像生成服務(Text to Image),尤其是二次元動漫風格蔚為風潮,也引發爭議。NovelAI基於Stable Diffusion開源模型打造的付費服務。其模型脫胎自動漫插圖分享平台Danbooru(日語瓦愣紙)500多萬筆圖片,優異的動漫風格品質與生產效率,使大量AI圖片湧入主流繪師聚集地,如Artstation與Pixiv。真假莫辨的AI動漫圖片引起大規模繪師的抗議潮,知名繪師發現自己的名稱已成為一種風格,成為可供使用的提示字之一。2022年12月,加拿大繪師Nicholas Kole在作品展示平台Artstation發起「No to AI Generated Image」活動,一時之間平台頁面可以看到斗大的AI字樣被打上禁止符號的圖片充滿網頁。但這已經無法阻擋AI往下前進,除了NovelAI,成千上百的動漫模型都可以在免費開源的機器學習倉庫抱抱臉(Huggingface)找到。

《AI真人辨識測驗》的小模合成圖片與NovelAI二次元合成圖片,皆來自開源免費的AI模型 Stable Diffusion。Stable Diffusion由StabilityAI於2022年8月底發表,其模型以將近60億張帶有標題的圖片進行訓練,並開放原始碼。此前主流繪圖AI軟體如Midjourney或Dalle皆為封閉式服務並且為雲端軟體(意即無法離線使用)。Stable Diffusion一次打破這兩項限制:開放原始碼讓任何人都可以修改模型並使用其他人創造的新模型;同時Stable Diffusion實現了只要擁有消費級顯示卡就可以合成圖片的目標,這代表技術創新或藝術創作的最小單位不再是一個巨型新創組織,而是一個人與一台個人電腦。

這兩項特色,除了讓AI繪圖在技術上創造可快速迭代的優勢之外,也在社會文化層面打開了潘朵拉的盒子:敏感內容(Sensitive Content)。這是具有道德包袱的商業平台做不到的事。

2022年8月,與Stable Diffusion問世的同一時間,美國遊戲公司執行長使用Jason Allen使用線上AI製圖服務Midjourney製作作品《Théâtre D’opéra Spatial》(太空立體歌劇院),奪得美國科羅拉多州博覽會(Colorado State Fair)藝術競賽的數位藝術類首獎,並引起輿論大量討論。Midjourney引起話題的極限大致到這裡,但Stable Diffusion遠遠不止如此。如果你使用Midjourney(使用方法為在社交軟體Discord下咒語,機器人會產生圖片給使用者),會發現許多敏感字眼無法使用,政治類如政治領袖、成人類如N.S.F.W(Not Safe/Suitable For Work)。但Stable Diffusion因為本地端服務,解開了所有限制。使用者可以使用自己的電腦進行「完全自由」的創作,不會有平台、軟體規範綁架你。

「傑出的藝術家模仿,偉大的藝術家盜竊。」(Good artists copy, great artists steal.)如今這一句必須再加上「偉大的演算法盜竊全世界。」(Great AIs steal the world.)而下咒者將踩過禁忌,操弄全世界。

感謝大大無私分享 — 慾望湧現的共享生態系

以《AI真人辨識測驗》使用的量產小模為例,來描述AI發展有多快速。2022年2月,匿名人士TASUKU2023使用Stable Diffusion訓練出亞洲女性為主題的模型ChilloutMix,訓練資料集不明,但特別適用於網紅或Coser(角色扮演者)的合成圖片,頓時東亞各大社群平台充斥量產小模;隔週Kbr以ChilloutMix作為基底,推出特化版的LoRA模型(Low-Rank Adaptation of Large Language Models),如韓國娃娃(Korean Doll Likeness) 、台灣娃娃(Taiwan Doll Likeness)。簡單譬喻,ChilloutMix有如紙娃娃系統,而LoRA為上頭的捏臉過程,使用LoRA可以確保臉型維持穩定一致的特色,此時神似韓國流行團體成員的合成圖片已經漫溢各大平台,過去韓國早已有神似真人的AI虛擬偶像,如Eternity,但此刻合成圖片的創作者已經不是業者,而是廣大而幽微的一般人。同時網路上的開源模型倉庫,已經充斥大量不同明星與動畫角色的蘿拉模型(LoRA),這是因為製作一個蘿拉模型實在太容易,只要至少15張低解析度相片,十分鐘即可完成。

AI的光速演化還未結束。當大家開始訕笑AI合成圖片的手指扭曲、肢體不自然,二月第二週週末,史丹福大學博士生Lvmin Zhang推出Stable Diffusion開源擴充套ControlNet,使得AI可以自動辨識範例圖片的人物骨架,或辨識使用者提供的線條作為合成圖片索引,並可辨識範例圖片景深,從此「可控的」隨機性更加精準,AI人像進入更加難以辨別真假的境界。同時中國已經發生使用AI美女圖進行海灘遊艇派對的詐騙事件⋯⋯。

2月28日,可能是因為太多人踰越界線,網路上出現不堪入目的合成圖片,TASUKU2023選擇將ChilloutMix自各大AI模型倉庫下架,並在推特說明:「我不必刻意留在戰場,因此我將模型改為自公開頁面下架,請大家使用替代模型找樂子。我想繼續創作女性和兒童都可以享受的內容。退出對我來說是一件大事。(原文為日語)」同一天晚上,Kbr也將台灣、日本、韓國娃娃的LoRA模型下架。短短一個月新興科技(Advanced Technology)出現令人難以想像的發展,並造成社會文化層次的湧現事件(Emergence)。

瘋狂的2月或許可以蛇形藝廊(Serpertine Gallery)於去年11月推出的《未來藝術生態系3:藝術與去中心技術》(Future Art Ecosystem 3: Art & Decentralized Technology,以下簡稱 FAE3)觀照。FAE系列叢書一直以來作為倫敦蛇形藝廊探討藝術與先進技術的總成,並且討論21世紀文化基礎建設應該為何。這一次國際AI繪圖模組共創過程,各地創作者(不一定是工程師)以欲望作為動機,共享彼此的開放源碼與創作心法,雖然不是當代藝術中嚴肅、提問、反抗的創作脈絡,卻仍可帶給我們生態系建構的啟發。

蛇形藝廊《未來藝術生態系》系列叢書,全套皆可線上閱讀。(© Serpentine)

當可模組化的AI創作模式誕生,資料集(dataset)、機器學習模型(model)、輔助擴充模型、提示詞(prompt)都可以成為彼此共享(Shared)、可組合性(Composability)的創作零件。在此最重要的前提是可互通性,唯有開源(Open Source)與開放授權(Open Content Licensing)才能成功創造高速迭代的創作環境。我們可以從此次AI合成圖片的共創過程為藝術與先進科技(Art & Advanced Technology)帶來一些借鏡。

FAE3提到「當藝術家與人工智慧合作時,需要學會駕馭電腦算力、巨量資料庫,此外也須與懂演算法模型的工程師互動。而且藝術家必須深入瞭解整個人工智慧的系統運作,才能設計出有效的介入行動、並產出有意義且可預期的結果。… AI模型藝術品實與大家預期中會在藝廊看到的藝術品相差甚遠。不過科技藝術作品可以成為公眾討論的話題,讓這些科技知識不再如黑盒子一般不透明。這些作品讓大眾還在懷疑新科技時,讓更多人討論關於一門新科技的社會正義、社會權力與宰制問題,使這些科技能夠更廣泛地被人們所適應。 」

此外FAE3針對協作模式也提到:「未來的藝術生態系統惟有大規模互相合作、互相通約才有可能超越目前市場產生的效果。…我們的提案更接近藝術的「GitHub」(編按:由軟體工程師貢獻程式碼的開放式資料庫),藉由創造一個公用的協定標準,以開放方式建構新機構時,可以大幅度降低進入門檻。 」AI合成圖片工具也有如同GitHub般的倉庫,如抱抱臉(Huggingface)或 CiviTai。「當開放、去中心、人人都可使用的網絡水到渠成,我們可以重新思考草根、自下而上與集體的社會互動模式。 」

人工智慧具有非對稱(Asymmetric relation)特色,意即訓練需要消耗極大量的人力物力,但使用成果非常簡易。有賴於運算晶片發展成熟、機器學習演算法已可本地化、開源工具開放使用、不同套件與工具彼此具有可互通性、並且開任意上傳下載的集中式平台存在,讓AI創作工具百花齊放,並擾動社會。

延伸閱讀|【張寶成專欄】從「前瞻科藝」到「21世紀文化基礎建設」:《未來藝術生態系》三冊大綱 (上)

延伸閱讀|【張寶成專欄】用「分散式科技」打造「21世紀文化基礎建設」:《未來藝術生態系》三冊大綱 (下)

匱乏夢境 — 破圖與插值作為兩種AI世界觀

機器學習演算法作為創作方法大致上可以以2022年中作為分野,粗略劃分,此前多數數位藝術家使用生成對抗網絡(GAN)工具,後來多數平台與使用者使用擴散模型(Diffusion Model),如OpenAI的DALL-E2、Google Brain推出的Imagen與可能的Midjourney。在此不詳細解釋兩種技術差異,但推估兩種演算法造成創作上的歧異。(註5)

前者相對捉摸不定,被藝術家特意用做破圖之功,尋求遊戲世界的臭蟲(bug),在理性有序的數位世界中捕捉破碎解離之美,彷彿機造影片(Machinima)審美風格延伸。台灣收藏群體Volume DAO於2022年3月曾在台北策劃AI藝術收藏展覽「機器會夢見NFT嗎?」,其中收錄作品多為海內外藝術家使用GAN模型鑄造而成的數位藝術品(NFTs),如馬修.普魯默─斐南德斯(Matthew Plummer-Fernandez )的《洞穴彩繪》(Cave Painting, 2021)、巴斯.烏特維克(Bas Uterwijk, Ganbrood)的《銀河皮條客》(Le Souteneur Galactique, 2021)與迷莫.阿克騰(Memo Akten)的《觸手怪物們》(Tentacular Critter, 2021)等。前段介紹之《屠夫之子》(The Butcher’s Son, 2017),也是馬里奧.克林格曼(Mario Klingemann)使用GAN模型進行創作。

迷莫.阿克騰(Memo Akten)的〈觸手怪物們,172號〉 Tentacular Critter #172

此外克林格曼於2021年底創造了可自我運轉的AI機器藝術家〈Botto〉(2021),透過代幣經濟與分散式治理工具,透過社群成員(真人)的票選與命名,定期生成之合成圖片作為數位藝術品,鑄造為NFT上架銷售,其中最貴的作品當時逼近800萬台幣。這位機器藝術家,最早使用GAN模型(VQGAN+CLIP),隨後也更新了Stable Diffusion模型。而長期將自我圖像與聲音開源共享,以處理數位孿生(Digital twin)著名的藝術家荷莉.亨頓(Holly Herndon),除了是第一位擁抱深偽(Deep Fake)技術的藝術家,也提倡GAN模型創作框架的共享。(註6)

而後者的出現創造如同本文前段所述,創造的世界觀相對精確可預判,在產噪與降噪過程中煉金,並且藉由多元大量的擴充模型限制可能性。如果說使用GAN模型的創作者類型是在有限框架中抽出無限可能;擴散模型的使用者可能是尋求插值(interpolation)產生的合理性。舉世聞名的科幻作家姜峯楠(Ted Chiang)於今年二月九日在紐約客(The New Yorker)雜誌發表〈ChatGPT是網路上的一個模糊JPEG文件〉(ChatGPT Is a Blurry JPEG of the Web),雖然是描述大型語言模型(Large Language Model, LLM)但也可以類比至最近的AI合成圖片發展方向。使用者社群對於「咒語—成品」之間的模糊性感到驚奇,江將其描述為「有損壓縮」與「暴力還原」的往返過程,機器重新包裝資訊,無意義的產出(無論為文字還是圖片),都是它理解人類集體幻覺的方法。

機器產生無比鮮明的幻象,不是因為機器具有想像力,而是因為人類的集體資料集中,已經錄有數十億張「記憶」,如同人類睡眠時,視覺皮層的腦神經活躍互動,撞出一齣齣意外的夢境。而不論「破圖」還是「插值」,由人工智慧產生的合成圖片,為首次人類可清醒討論的「集體夢境」。

當然「夢」與「慾望」在人類文明史中,向來水乳交融。這可能也是何以開源AI繪圖工具能在短短數月之中創造極為大量的範例,這是一種集體春夢。

虛擬真實 — 虛擬作為即將實現的潛在

但我們可能最終發現人類(或者異男)的夢境是如何平板蒼白。如今瀏覽Pixiv插畫網站或各類AI小模圖庫,多來自同樣幾個模型。這與透過演算法瀏覽Instagram網紅圖片或抖音短影片竟沒什麼兩樣,都是過度修飾、五官精緻、身材有致的量產美女。前者是透過人工上傳量產合成圖片,後者為透過機器演算法篩選大量刻意經營的真人圖片,路徑相反的兩者結果竟如此神似。

2002年由安德魯.尼可(Andrew M. Niccol)的電影《虛擬偶像》(S1M0NE, 2002)講述了數位創造物擊中集體品味,並凌駕造物主的故事。主角導演由於受不了頤指氣使的真人女演員,遂與工程師合作打造了虛擬女主角席夢(Simone),並執導了多件賣座作品,讓席夢成為人氣女星,甚至獲得奧斯卡最佳女主角獎。電影後半導演見席夢已經逾越自己的地位,便使出各種手段意欲摧毀席夢的公眾形象,但結果與預期相反,席夢名聲如日中天。電影末段,導演已無法證明席夢從未存在,並涉嫌謀殺席夢而被起訴。法國哲學家亞蘭.米龍(Alain Milon)於《虛擬真實:我們的身體在或不在?》描述本電影「藝術—自然的關係,或是創造物—創造者關係的傳統模式,已經不再是要探討的問題了,真正要探討的是:如何顛覆,怎樣倒置。」此電影之女主角尤其往想像中的無瑕疵無個性進行選角,20年後數位合成身體的想像竟與當時如此相像。但這次平板單一的男/女主角(合成女性的比例仍佔多數)想像,是真正由集體心靈與集體創作者共同打造。

AI合成圖片的炫風也吹向角色扮演圈,由於ChilloutMix特別適合製作合成Coser(角色扮演者),此刻已出現大量LoRA模型,優化特定動漫人物。此時只要一鍵便可將漫畫人物轉換為逼真的真人Coser。這很有可能是因為訓練資料集早已具有大量Coser與繪師同人二創(二次創作,Derivative work,二次創作原創角色的作品)圖片,且這些圖片都已透過創作者標籤化(Labeling),相當適合訓練演算法。因此「動漫角色 — 同人二創 — 真人Coser — 合成 Coser」在角色詮釋性上產生多樣複雜的關係。在《少年Jump+》上連載的漫畫〈2.5次元的誘惑〉(2019-)為一部刻畫Coser入微的熱血漫畫,講述主角群如何仔細詮釋與自我裝扮為心目中喜愛的動漫角色。在該漫畫中, Coser在扮演虛擬角色上是有明確目的的,如何詮釋出最接近的感覺,並且讓動漫展會上的群眾感動而定。而同人二創的創作心理,可能也是希望透過筆下的創作物,活化內心喜愛的角色並起創造驚喜吧。在這兩重脈絡下,合成圖片的誕生,不論真人還是繪圖風格,都是最逼近「擬真」的方法。未來或許產生倒置,動漫群眾首先學會欣賞AI Coser,真人Coser先產製合成圖模擬,幫助自我詮釋,並作出合成圖做不出來的事。此間AI的橫空出世已成為動漫生態系不得忽視的一員。

本文作者製圖:以漫畫〈2.5次元的誘惑〉作為「動漫角色 — 同人二創 — 真人 Coser — 合成 Coser」四象限案例

《虛擬真實》一書以整形的歌詞作為開場,探討改造身體。「究竟我們的文化是如何透過虛擬身體建造了身體意象,就像整型外科讓幻想成行實現,而其中第一個效果經常是打造了一個失真的身體。我們很難分辨什麼時候是修復整容(天生缺陷),哪時候是造型美容(迎合當下的身體潮流)。」在人工智慧創造的合成圖片成為標準配備的現下,更值得重讀《虛擬真實》。《虛》探討從虛擬世界身體的標準化,討論社會忽略多元身體的現實:「當真實的身體只剩下一些標準值,值得提問的反而是,誰模仿了誰:是虛擬真實,或者「如假包換」的真實呢?虛擬真實通常被視為以真實為典範,就像虛擬實境中的資訊法則;而真實則往往追尋理想的典範,這個理想典範通常被認為能體現科幻世界中的虛擬真實。」

同時《虛》也提到網路性幻想,可作為合成網美圖片的現象書寫:「網路性幻想預設了身體的愉悅可以跨越身體本身,欲望只不過是幻想配置的一段故事,刻劃了一個比日常空間還要私密的社會世界,或一個比社會生活的性慾還更加被實現的性慾。」並且指出虛擬與真實之間的差異並非一個光譜,而是兩個軸度:「虛擬並不是真實的替代,就是虛擬也不比真實還要真實或不真實。虛擬就只是真實的一個屬性。」讓我們可以看清楚究竟真實為何物,或不為何物。

最後《虛》也引用1988年的論文,探討數位影像是否為藝術,我們也可以援引此見作為AI合成圖片的結語:「數位影像的結構是組合式的,而藝術影像的結構則非如此。一個數據組合衍生而出的影像算不上藝術,因為藝術的思想永遠會在思想陳述的銜接中產生斷裂:由於缺乏這樣的斷裂,影像只是處於圖庫,而非藝術。」(註7)

結語

慾望與技術發展常伴左右,AI繪圖的可組合性與互通性,自今年以來引爆開放創作社群的發展。在藝術生態系的生產層次發展上,變革技術(Transformative Technology)如人工智慧產生新型態的協作模式。AI使用者的開源互助過程,可供藝術生產、合作借鏡;同時單純AI繪圖產製過程仍缺乏「斷裂性」,暫時不必擔心藝術家會被搶飯碗,畢竟這是人類文明最複雜的職業,強人工智慧至今仍未出現。如同克林格曼等藝術家早已擁抱合成圖片工具,作為創作媒材軋上一角,本土藝術家又何必費神呢。

此外,即使科技宅男創造的異男世界觀仍在合成圖片的圖庫中佔大多數,多元性別其實已在AI模組中慢慢開花結果,人工智慧的非對稱性,讓使用者可以兼容並蓄多樣興趣。或許容我們繼續觀察自動化創作常民化之後,創作風格是趨於多元,還是最終將邁向集體合成(Synthetic,合成的、人造的、造假的)的終局。


額外案例〈鏈鋸人〉官方宣傳 vs. 合成Coser

本文作者以Stable Diffusion進行img to img產生的鏈鋸人擬真圖。(黃豆泥提供)

註1 由該測驗作者binnin公布的測驗結果 [閒聊] AI真人辨識測驗 結果出爐 – 看板 DSLR – 批踢踢實業坊 (ptt.cc)

註2 A. Michael Noll, “Human or Machine: A Subjective Comparison of Piet Mondrian’s ‘Composition with Lines’ and a Computer–Generated Picture,” The Psychological Record, Vol. 16. No. 1, (January 1966), pp. 1-10.

註3 引述自《人工美學:人工智慧、媒體與設計的重要指南》Lev Manovich & Emanuele Arielle, Artificial Aesthetics Acritical guide to AI, media and design, 2022.

註4 Kolah, The State of the Generative Art Market, 2022, https://www.kaloh.xyz/p/the-state-of-the-generative-art-market

註5 關於機器學習模型,由Mia Tang繪製圖文介紹 https://www.mia-tang.com/blog/ml-models

註6 GANs and NFTs, Brian Droitcour, Art & America, https://www.artnews.com/list/art-in-america/features/gans-and-nfts-1234594335/robbie-barrat-ai-generated-nude-portrait/

註7 Marc Le Bot, Les machines, Travers, no.44, septembre 1988, Paris, CCI, p.60

黃豆泥( 26篇 )

分散自治與數位主權探求者,白天於公部門服務,晚上為FAB DAO與Volume DAO成員,曾以《百岳計畫》(Project %)參與2022年林茲電子藝術節,並規劃北師美術館《Kng DAO》(2022)、台北國際藝術村《鏈上駐村》(2022, 2023)。嚮往制度設計與新興科技的撞擊,正在尋找有別於電馭極權與財閥亂鬥的第三條路。