正在閱讀
雲端之鑰Keywords for Database:解鎖資料庫挖寶趣

雲端之鑰Keywords for Database:解鎖資料庫挖寶趣

網際網路科技的發達,具現了知識無垠的意象。講究公共財的趨勢下,研究機構推廣線上資料庫,打破實體空間的侷限性,開放大眾查閱瀏覽,促使知識的普及化。各大機構建置的資料庫之外,網際網路提供的資源亦不容小覷,世界各地上載資訊的數量和類型數以萬計,如同遍地蔓生、綿延不絕的草莖,彼此相連成串,人們從迥異的節點入手,隨著關注焦點及檢索關鍵的差異,開展成多元、璀璨又獨特的知識圖譜。

網際網路科技的發達,具現了知識無垠的意象。講究公共財的趨勢下,研究機構推廣線上資料庫,打破實體空間的侷限性,開放大眾查閱瀏覽,促使知識的普及化。各大機構建置的資料庫之外,網際網路提供的資源亦不容小覷,世界各地上載資訊的數量和類型數以萬計,如同遍地蔓生、綿延不絕的草莖,彼此相連成串,人們從迥異的節點入手,隨著關注焦點及檢索關鍵的差異,開展成多元、璀璨又獨特的知識圖譜。

大都會博物館「#MET Kids」網站中,用圖畫說明自己的特色館藏,點擊紅點即可瀏覽文物。正如羅浮宮及大多博物館一樣,收藏呈現多元紛雜面貌。圖取自該館網站。

在科技輔助下,大數據(Big Data)成為數位人文的重要基石。它拓展了知識的廣度及深度,進而成為學術研究上不可或缺的工具。然而值得一提的是,雖然它在文字資料搜索上頗具成效,但圖像資料方面卻往往是事倍功半,主因與電腦如何「理解」圖像有關。相較於文本可切割成單字、詞組及句子等不同大小的語言單位,便於電腦保存並輸出成為使用者使用的資料庫系統,圖像顯得複雜且費解。Google、Tineye提供「以圖搜圖」的功能,透過辨識圖像中的主要物件特徵,如顏色、紋理及形狀等,作為尋找相似圖片的依據;除此之外,另一種搜索方式則仰賴人們提供文字描述及標籤等資訊,提供使用者用關鍵字搜尋圖像,目前廣為圖像資料庫所使用。

為什麼科技發達、時代進步,資料庫還是很難用?

仰賴文字描述的圖像搜索,或多或少會帶來搜尋結果上的偏差影響。在普遍的情況下,描述圖像內容並非難事,大眾對特定物件的認知差異性不大,因此使用者很少遇到搜尋結果和內心所想差異懸殊的情況。不過若運用至博物館的典藏資料庫上,這類檢索方式的瑕疵卻變得顯而易見。

博物館的收藏多元紛雜,一旦考量到文物圖像背後的文化脈絡,更提高了資料庫搜索功能建置的困難度。每個博物館都有一份冗長且無止盡的收藏名單,典藏資料庫即是這份清冊的視覺化呈現。博物館收藏大多雜亂無章,正如義大利符號學權威、歷史學家暨《玫瑰的名字》(Il nome della rosa)作者安伯托.艾可(Umberto Eco)在2008年美國大學演講中,闡述「名單」概念時,幽默地道出博物館收藏名單的混亂:「一個不了解我們的藝術概念的外星人一定會覺得奇怪,為什麼羅浮宮會收藏一些日常使用的小玩意兒,像是花瓶、盆子、鹽罐、女神雕像例如米羅的維納斯,風景畫,一般人的肖像,陪葬的物品和木乃伊,怪物的畫像,神像,人們受到折磨的影像,戰爭的畫像,意在引發情慾的裸體雕像和畫像,以及考古發現。」

世界知名文博機構如大都會博物館(Metropolitan Museum of Art)、大英博物館(British Museum)及上述所提的羅浮宮(Musée du Louvre),館藏來自五洋七大洲,因此撰寫藏品的文字描述時,沒有文化差異、普世性的關鍵字成為上選,並著重在時間、地點、材質、顏色、作者等基本資料。這些文字描述,一方面無法準確說明及呈現藏品的特殊性,另一方面對研究者、一般大眾都不夠友善方便,查詢者若不記得藏品題名,抑或無法掌握藝術品的基本資料,便很難查詢到自己所需要的圖像內容。資料庫原本期望能在實體展覽之外,提供外界另一扇窺探知識的窗戶,但實際設計上,卻宛若層層複雜的迷宮,即便大眾可在資料庫中漫無目的亂逛,發散式地欣賞及認識文物,卻很難靠一己之力,找到一條敘事清晰的途徑,去認識及了解博物館收藏蘊含的多元文化。

國立故宮博物院提供的經典圖像下載,提供查詢功能。圖取自該館網站。

對專業學者而言,資料庫提供的圖像搜索過於簡陋,帶來的研究效益不大。因此有新的方案出現,對搜尋提出改良方針,即是提供「索引」的網站,像是普林斯頓大學(Princeton University)提供的「中世紀藝術索引」(Index of Medieval Art),以及維多利亞與艾伯特博物館(Victoria and Albert Museum)主掌的「中國圖像索引典」(Chinese Iconography Thesaurus)。奠基在藝術史研究的基礎上,挪用圖像誌(iconography)的概念,去探索圖像中涉及的歷史主題、文學意涵及特有圖式等,進而歸納出具有意義的描述詞彙,增加檢索的效力。

除了檢索機制的問題,翻譯上的不統一亦是資料庫無法充分發揮功用的主因之一,中國藝術尤是如此。中國藝術登上國際之際,翻譯就是研究者頭疼的議題。早期投入中國藝術研究的學者蘇珊.布希(Susan Bush)曾表示:「中國的思維和理解闡釋系統是建築在一個完全不同於西方的文化基礎之上,這些,我們必須予以考慮。」例如中國書畫提倡的「氣韻生動」,考倒了無數人,有的翻成「Rhythmic Vitality」,有的譯為「The Life Movement of the Spirit through the Rhyhm of Things」(註1)。若要重視字詞原有的語境,部分學者支持「音譯」,用拼音來表述中文音節的抑揚頓挫,經由保留原有字詞發音的方式,去留住字詞蘊含的特殊文化語境。

「中國圖像索引典」由英國政府數位、文化、傳媒和體育部(DCMS)贊助成立,維多利亞與艾伯特博物館主持執行。圖取自該資料庫網站。

這樁「音譯」或「意譯」的翻譯之爭,至今仍未有定論,這也導致各大博物館沒有共通的翻譯用法,大多是根據館內研究成果釋文及最初入藏的清冊資料,制定藏品名稱。因此館方若未提供原文題名,不僅搜尋特定作品是一項艱鉅任務,也很難在不同藏地找尋相同畫題的作品。

點擊滑鼠,重拾挖掘資料的樂趣

現今的網路資料庫尚有進步空間,這是無庸置疑的。只不過就算不完美,資料庫仍有不可抹滅的成就─打破傳統學術的藩籬疆界,落實「去中心化」的理想。使用者在查詢資料的過程中,著名作品不再獨占鰲頭,人們反倒從搜尋結果中,看見許多名不見經傳、長年以來被忽略的文物典藏。誠然,不準確的搜尋結果令人心煩,卻也能看做意料之外的收穫。拓展視野的同時,不失為尋找研究靈感和設計創意的妙方。

當質疑資料庫提供的資訊過於簡單之際,也須理解這些「基本功」的重要性和得來不易。從作者、年代、畫題到介紹說明,這些資料看似基本,卻是不同時期推論考據出來的學術成就。資料庫提供入門者對作品的基本認識;而對研究者來說,它則是一個回顧學術史的發想起點,重新認識這些理所當然的知識,用嚴謹態度考據它們的立論基礎、歷經的學術爭論以及來龍去脈,正如「引用文獻追蹤」(Citation tracking)研究領域中,強調藉由不斷追溯文獻的引用來源,找到學術立論的原點。當資料庫被視作一個值得研究的文本,它能夠反映出的學術面向,便更為豐富且多采多姿。

發展至今,網路資料庫一直是利大於弊,開放便是它的最大優勢。網路資料庫讓世界各地的藝術愛好者不再遠遠遙望這些珍貴古董,而是從清晰的照片中學習及互相切磋。博物館開始與社會互動,圖像分析不再只是研究者的權力,大眾對文物的想法和詮釋也受到接納,促使群眾協作(Crowdsourcing)的產生,如國立故宮博物院2018年順應國際潮流,邀請大眾對藏品建立社群標籤;另如荷蘭國立博物館(Rijksmuseum)網站上的Rijks Studio,提供群眾自行規劃自己的專頁,收藏自己喜愛或感興趣的項目,是博物館推動社群協作的重要範例。集合眾人之力,具有相似母題和圖式的文物被聚在一起,南轅北轍的文化也因此產生連結。隨著交流史研究的興起及蓬勃發展,近年來流行探討貿易商旅下的文物傳播,視覺和物質文化成為顯學,藉由眾人不同觀點的激盪,為藝術史建立更宏觀的跨文化觀點。

荷蘭國立博物館(Rijksmuseum)網站上的Rijks Studio,提供群眾自行規劃自己的專頁,收藏自己喜愛或感興趣的項目,是博物館推動社群協作的重要範例。圖取自該館網站。

雲端空間縮短了實體空間的距離感,少為人知的文物也被揭開神祕面紗。邁入21世紀,如今的研究已有不同於以往的樣貌,中國藝術史更是如此。過去在網路不發達的限制下,許多流落於海外的中國文物少有展示的機會,人們難以一親芳澤,尤其是早期不被重視的大眾文化,如版畫、日用類書及民窯等,如今已成為學界關注的面向,與經典名作相比,這些圖像資料依舊存在許多待解之謎,亟需有系統的整理、研究及探討。

掌握資料庫的檢索原理及侷限性,便能清楚知道它蘊含的潛力和強大能量。許多文章提供了資料庫的資訊及性質,然而少有人為資料庫的運用提供示範。新專欄「雲端關鍵字」由本期開始,將以中國藝術史的類目或特定文物為發想,透過各資料庫的檢索及串連,探索它們在各地的收藏情形、歷史脈絡以及研究現況。除此之外,文中會羅列各資料庫的譯名,讓藝術同好能夠「按文索圖」,作為再度查閱驗證的參考依據。這一系列會是新的嘗試,盼能拋磚引玉,也歡迎讀者提供意見和想法,一同加入「雲端挖掘」的挑戰任務!

註1 關於謝赫六法及其他歐美學者碰到的翻譯難處,可見王菡薇〈試論歐美中國藝術史中的一些語言問題〉,《二十一世紀》網路版,2005年4月,總第37期。


【雜誌購買連結】

典藏官網
蝦皮

【更多古美術最新消息】

FaceBook
Instagram

朱子毓( 10篇 )
查看評論 (0)

Leave a Reply

Your email address will not be published.