正在閱讀
「已知用火」的藝文統計與政策(1)─這不是大數據!從兩廳院「解碼大數據報告」談起

「已知用火」的藝文統計與政策(1)─這不是大數據!從兩廳院「解碼大數據報告」談起

國家兩廳院連續兩年的報告均以「大數據」這個名詞加以宣稱。一個國家級表演藝術最高專業機構,卻完全不懂大數據的意義,也反映了過去藝文界曾經跟風喊過的「Big Data」議題,始終停留在「拿香跟拜」的程度。
《兩廳院售票系統消費者行為報告書 2013-2019》第1頁。( © 兩廳院售票)
連續兩年,國家兩廳院就其營運的「兩廳院售票系統」委託交通大學統計研究所助理教授、同時也身兼音樂創作者的高竹嵐,著手進行自2013年以降,線上與端點售票系統消費行為的分類統計。(註1、2)
令人有點意外也不大意外的,是國家兩廳院連續兩年的報告均以「大數據」這個名詞加以宣稱。一個國家級表演藝術最高專業機構,卻完全不懂大數據的意義,也反映了過去藝文界曾經跟風喊過的「Big Data」議題,始終停留在「拿香跟拜」的程度。
「大數據」大什麼大?這並不是說把售票系統一年賣出的上百萬張票券在那裡加減乘除,就堆得出「大數據」。藝文界長期以來往往用「數學不好」來搪塞對各式數據意義的呈現與解讀能力闕如的情況,但數學不好,不代表統計觀念就無法理解,更不代表就可以錯解數據演算時代的方法意義。
「大數據」最基本意義在於它是數量龐大、多樣、及時孳生累積更新、多點運算、資料真實性的高修正度,在高速網路社會高度奠定基礎後,所形成的一種(無法用傳統方式處理的資料統計)數據資訊技術。在當代,任何產業皆有機會透過大數據工具的海量資訊,及時預測未來趨勢,以致於「大數據」成為各產業都力圖發展的數位技術。值得強調的,此時此刻它已是成熟運用的「技術」,而非引盼尚欠東風的科技。
摘自《兩廳院售票系統消費者行為報告書 2013-2019》。( © 兩廳院售票)
此次為兩廳院官方刊物《PAR表演藝術》6月號專題撰寫分析文的臺北藝術大學藝術行政與管理研究所助理教授黃蘭貴表示,她和計畫主持人高竹嵐其實都有盡量避免以「大數據」來宣稱售票系統分析報告。然而,無論是國家兩廳院官方新聞稿,售票系統消費行為報告書第一章,又或是《PAR表演藝術》專題的大標與內文,均使用「大數據」一詞,刻意渲染這份堪稱老舊而有限的消費者統計分析所能解讀的詮釋效度。
況且,這些資料分析的方向,有不少是「自我選擇偏誤」或「倖存者偏誤」所造成的觀測性解讀資料。如果我們已知,應該像黃蘭貴特別在分析文章裡強調「兩廳院售票系統會員(樣本)不等同全體表演藝術觀眾(母體)。」那麼,除了再次預設了國家表演藝術中心先後在2016年開幕的台中國家歌劇院和2018年第4季開幕的衛武營國家藝術文化中心所帶來的票房量能效應,從而忽視了也許存在著像是年代售票、寬宏售票等系統在表演藝術委賣的檔數可能萎縮而產生的「倖存者偏誤」。畢竟,透過國表藝三館的成立,表演藝術票務更趨向集中於兩廳院售票網是顯著的生態現實。
摘自《兩廳院售票系統消費者行為報告書 2013-2019》。( © 兩廳院售票)
即使連續兩年受委託撰寫統計報告的高竹嵐在專題強調:「雖然有大量非會員之購票,但由於會員購票之總金額超過全體系統消費之六成,故會員之分析仍對於消費者面貌之刻劃有一定程度之代表性。」然而,我認為研究統計學的高竹嵐在這個資料詮釋上避重就輕。首先,「會員購票『總金額』超過全體系統消費六成」,如果從報告書裡的資料,38%的會員消費超過年度會員人均消費兩倍、10%的會員更超過四倍,這樣的「重度消費者」偏峰分佈來看,重新換算為數量的單位,反而是「非會員購票數」遠大過於年度總售票數的六成。黃蘭貴也強調,「這群會員也不過是佔兩廳院售票系統購票者的一部分,非會員身份的購票者是完全沒資料,無法納入分析。到底這群人能否做為推論母體的代表性樣本,我也沒答案,且傾向覺得不能。」
其次,53%的購票行為超過兩張,這當中也未計入「委託其他會員代購」的會員購票行為,更不包含通常透過劇組團隊代購的「團購優惠票」或是現場臨時刷出的票券,大多也流向重度消費者的身上,這也是在解讀統計資訊上的自我選擇偏誤。於是,官方太習慣對「大數字」交代,而放棄對產業而言更核心的重度使用者進行分析,從而認為消費人口總數的意義大於重度使用者,這顯然是非常需要改掉的官僚統計數據習性。
總票房、總場次在這樣的統計其實無足輕重,畢竟場次型態隨著中小型演出的的票券單價上漲,以及小規模演出場次的比例大幅提高,總票房提升充其量反映的是表藝消費的通貨膨脹。至於將2013-2019年的7個年度會員數字個別加總,說實際購票會員數有106萬人(而不寫『人次』,但即便寫人次也是毫無意義的垃圾資訊加總),實在不知是為了向長官或是文化部交代,還是作何其他居心呢?這7個年度裡,即便會員購票人數從14.9萬上升到19.7萬,可想而知極大多數是重疊的會員,把不同年度的同樣一批人口乘以7,就是無意義的官樣統計。
摘自《兩廳院售票系統消費者行為報告書 2013-2019》。( © 兩廳院售票)
Garbage in , garbage out.
此外,報告書內關於「每場可售票數規模」很理所當然地用200人和799人去介分出小型、中型、大型的演規分類,但這個數字明顯只適用在音樂(而且是西洋古典樂)類型演出,200人以下統歸小型演出,對於戲劇和舞蹈早已不合時宜。
至於節目類型按傳統的戲劇、音樂、舞蹈、親子等類別,除了親子類節目在消費行為模式較有參考度,在大數據可以輕鬆為節目行銷和企宣給出更多的數字外,制式類別只有聊備一格,讓報告書多出幾頁填充膨脹作用。
大數據可以為重度使用者,更容易找到他們的「菜」,也可以為設定前衛實驗或跨界(在傳統分類只能叫「跨域」)的混合式作品,不用再尷尬於傳統分類的定位,演算歸納出新的作品群集,而不是生硬的標籤。
摘自《兩廳院售票系統消費者行為報告書 2013-2019》。( © 兩廳院售票)
退一萬步言,即使當前售票系統可以取得的數據統計特徵多所限制,仍有許多更有統計意義的數據被忽略。統計平均場次票房,在這個觀眾參與量日益多元化與沉浸式的今天,還不如統計出平均上座率(完售率)。而平均上座率,還可以進一步分析出,今年到底刷出多少張貴賓票(也還有0元券與10元券之分),來看看台灣藝文界有多少是內部抵銷的「師長禮物經濟」?在近期小型演出發展的「贊助票」,又佔了這些票價差異化的小型演出多少比重,以及其產生的新的金字塔經濟支援關係?這些數據的走向,反而更令人關注,也至關生態趨勢發展之一二。
退五千步言,就算目前售票系統仍只能爬梳一小部分使用者資料,它必須要能和當今主流的社群或系統帳號相容,藉以通過「取得」的第一步,進而儲存、分析、視覺化。這是相對於開發完整內部大數據系統,相對容易達成的權變方式。
Open Tix售票網應用程式擷圖。(© 兩廳院售票)
今年4月,國家兩廳院舉行售票系統的新APP「Open Tix文化生活電商平台」宣告記者會,如今似乎仍在封測階段,但若像記者會提到APP系統願景:「未來系統可提供長條、圓餅圖呈現數據,不必等待EXCEL報表後續分析,讓節目主辦單位即時掌握銷售數據,以及消費者性別、年齡、社經地位等樣貌。」由此看來,國家兩廳院,真的應該認真學習什麼是真的大數據。
當然國家兩廳院可以持續覺得「數據大便是大數據」這樣的理念。畢竟,台灣表演藝術消費邏輯的「國營化」,也不是市佔率寥寥可數的民營場地可以匹敵的。否則,就憑宏碁那套遲緩不友善的機器,如何大夥20年用下來依舊乖乖就範呢?
據聞7月底,文化部紓困振興第三波「藝FUN券」,國家表演藝術中心轄下三館也「暖心」推出200元紙本抵用券……真的很傳統。至於「藝FUN券」和「三倍券」的振興措施,又透露了什麼樣的文化統計政策思維,且讓我們下篇為讀者分析。

註1兩廳院售票系統消費者行為報告書 2013-2019》。
註2 身兼統計學老師和音樂創作者「二刀流」文化學者高竹嵐,除了著手兩廳院售票消費統計報告,也很有雅興做了一首迷音歌曲
吳牧青( 90篇 )

藝術新媒體「典藏ARTouch」特約主筆

Copyright © 2021 Artouch Inc. 保留一切權利。