許雅惠(國立臺灣大學歷史學系教授)

 

 

1990年代個人電腦開始普及,2000年之後網路世界崛起,數位科技席捲人類生活不過是近三十年的事。至於「數位學習」這個領域在臺灣正好邁入二十年,原來是伴隨著「數位典藏國家型科技計畫」(2002-2007),出現了「數位學習國家型科技計劃」(2003-2007)。2008年數位典藏與數位學習這兩個計畫合而為一,又推動了一期,至2012年結束。[1]當時最流行的術語是「知識經濟」,知識就是力量,進入數位時代後,電腦便成為知識最重要的載體。

千禧年之初的這波數位化浪潮席捲全球,許多國家都以政府之力投入文化資產典藏的數位化,同時開發電腦科技運用於教與學之中。就在數位典藏與數位學習浪頭正高時,另一支被稱作「數位人文」的伏流也隨之而起。這個領域強調數位科技與人文的整合,2004年在一群橫跨人文、圖書館學、資訊科技等領域的學者,聯合張舉「數位人文」旗幟後正式建立。[2]這個數位人文學——無論是科技進入人文,或是人文擁抱科技——總之這個傳統與現代的結合發展力道強勁,已有國外一流大學成立專門系所。以科技之島自居的臺灣,也有真理大學設有「人文與資訊學系」,未來如何發展,值得關注。[3]

這幾個「數位」領域彼此息息相關,數位典藏將素材數位化,奠定各種應用的基礎。數位學習著重教育面,將典藏成果變成實務導向的學習內容;數位人文則廣納科技與人文的各個面向,研究、教學、應用都包含其中,與數位學習也不免有所重疊。[4]兩者的主要差別是,數位人文偏向上游的理論、工具開發及人才培養,數位學習則是後端的應用,將數位內容與工具技術進行轉化,以符合學習者的使用需求。

二十年前,我曾參與數位典藏工作;今日,又一隻腳踩在數位人文之中,科技力量始終一路伴隨。這篇文章回顧數位科技與人文的雙邊探戈,也算是一個人文學者脈絡化自身研究歷程的嘗試。如果我們將歷史的鏡頭拉長,會看到左右人文發展的數位科技力量,不是從2000年之後才開始,可以往上追溯到二十世紀中葉。

 

一、從計算時代到數位時代

 

所謂的「數位」就是把訊息轉換成0跟1,利用電腦進行運算與處理。現代的電腦大約出現於1940年代,是一種能進行複雜演算的大型計算機,需要一整個房間安裝它。使用者在特定的機器上將卡片打洞輸入訊息,然後送進讀卡機輸入電腦,等待計算結果。一般認為義大利的布薩神父(Father Roberto Busa, 1913-2011)是最早將電腦數位技術應用於人文學科的人,他在1949年得到IBM的支助,用電腦替中世紀的拉丁文神學著作建立索引,揭開「人文計算學(humanities computing)」的序幕。今日看來,這就是一種資料庫的工作,七十多年來這個索引走過大型計算機的時代、個人電腦的時代、進入網路時代,一路上歷經各種軟、硬體技術變革,至今仍屹立不搖,提供世界各地的使用者取用(網址:https://reurl.cc/ykoX62)。

早期的大型計算機由於體積龐大,費用高昂,只能由機構購置,個人不可能擁有。1974年第一台個人電腦Altair問世,電腦成為個人可以擁有的設備,不過在此初起階段只限於少數愛好者。1981年IBM 5150上市,這是數位科技發展史上的大事,從此以後個人電腦開始普及,能夠讓使用者方便地進行輸入與運算。下一個數位科技發展史上的大事是網際網路的出現,1990年全球資訊網(World Wide Web)建立,隨後在1993年出現html網頁,可嵌入不同類型的數位媒材,網頁之間也可以便利地互相連結。千禧年之後,隨著網路基礎設施的普及,電腦與人文之間的關係也跳脫資料計算,進入另一個數位媒體的新紀元。

上世紀電腦技術與人文之間的探戈,統稱為「人文計算學(humanities computing)」,本世紀2010年之後逐漸為「數位人文(digital humanities)」一詞所取代。我們可以在Google Books Ngram上統計這兩個詞語的出現頻率(圖1),兩者之間的消長顯然可見:

 

圖1:Google Books Ngram詞頻統計1950-2019年humanities computing, digital humanities二詞在英文書之出現頻率(2023年2月27日搜尋)

 

如圖1所示,兩個名詞都要到2010年以後才有飛躍的成長。在此之前,人文計算學的曲線自1985年開始緩慢上升,至1995年間有一波成長,應與個人電腦逐漸普及有關。

在數位與人文的交涉中,2004年是關鍵,就在這年,一群資訊科學、圖書館資訊學與人文學者共同張舉數位人文的旗幟,並將其界定為一個學科。在此之後數位人文一詞逐漸普及,並且於2006-2008年間超過人文計算學,2010年之後曲線更急劇上揚,成為熱門話題。上世紀的人文計算學雖然被數位人文所超越,不過這個詞語在2010年後也有所成長,且與數位人文的升降曲線是一致的,推測可能是討論數位人文時順道被提及。隨著數位人文的發展,2016年以後人文計算學的曲線一路下滑,不再上揚。

歷史領域方面,早在1949年便有美國學者利用電腦建立統計數據,六〇年代以後還刮起一陣「計量史學(cliometrics、quantitative history)」的風潮,但領域內的批評聲浪也不小。最著名的一個例子是關於美國南方奴隸制度的研究,作者計算某一種植場中黑奴每年平均被鞭打次數,以推論奴役的條件並不如想像中糟糕,這個研究引發其他美國史學者強烈的批評,也連帶質疑計量史學在方法上的有效性。[5]相較於美國歷史學界,英國似乎更能接受計算機所帶來的便利,學者們在1986年成立「歷史與計算學會(Association for History and Computing)」,成為歷史計算領域的先行者。

隨著數位人文的興起,也出現「數位歷史」一詞,舉凡歷史的研究與教學均包含其中。圖2計算Google數位化的英文書籍中,計量史學與數位歷史二名詞的出現頻率。整體趨勢與圖1相同,上世紀為計量史學所主宰,數位歷史的使用頻率在2005至2010年之間超過計量史學,2010年之後更呈現急劇增長的態勢。

 

圖2:Google Books Ngram詞頻統計1950-2019年quantitative history, digital history二詞在英文書之出現頻率(2023年2月27日搜尋)

 

從圖1、2來看,2005-2010年間電腦科技與人文的關係發生巨大變化,2010年以後,正式從過去的計算、計量轉而進入數位的時代。從計算到數位時代的學習,有什麼樣的發展?首先,從電腦硬體來說,計算時代靠的是個人電腦,以CD ROM光碟作為數位學習的主要媒介,乘載學習內容的光碟為封閉的單機介面,向使用者作單向的知識傳遞。此階段數位複製技術飛快發展,如:數位相機、掃描器,有助於平面與影音資料的數位化,為多媒體奠定基礎。

千禧年之後,網路的普及成為第一要務,2004年我國《數位學習白皮書》所勾勒的願景便是「收訊無死角,上網沒煩惱,人人有機會,生活無限好」。[6]隨著網路普及,多媒體與雲端技術的成熟,各種影音串流平台出現。網路的普及使得數據的收集變得容易且迅速,進而利用大數據訓練機器學習,開發人工智慧。今日的數位學習不再侷限於個人電腦,而是翱翔於網路世界中,這些網上學習資源經常是開放的,更加強調以使用者為導向,經常具有即時回饋的互動機制,學習不再只是單向的知識傳遞。

數位時代的人文研究也具有相同的特點,過去計算時代以電子資料庫的建置開發為主,單向地提供使用者檢索。今日則強調從研究者的需求出發,開發各種研究工具,不同的工具解決不同的問題,有如手機上的app一般,有的輔助文本閱讀、有的便利表格處理、有的生成視覺化圖表等,讓研究者能更迅速地處理更大量的資料。各種數位分析工具的開發,首先要了解人文研究者的使用需求,進而發現並界定問題,從而提出解決的辦法。

研究平台的出現也是近年值得注意的發展,平台上匯集各種好用的數位工具,讓使用者將自己的電子文本、資料匯入處理,之後再匯出進行分析。代表性的平台有臺大數位人文研究中心的DocuSky、中研院的數位人文研究平台中國哲學書電子化計劃(C-text)。這些平台的特色不一,各自整合不同的工具,就像格子店一樣,使用者到平台中選擇合於己用的功能。

工具與平台這麼多,是不是會有選擇困難?在數位時代作人文研究,第一要務是問對問題與用對方法(其實這句話適用所有研究)。問題、方法與工具間是否能無縫接軌相互配合,決定了一個研究的有效性。什麼樣的問題適合用數位方法?有哪些好用的工具?以下用北宋收藏家趙明誠的例子來說明。

 

二、數位人文研究舉例:以北宋收藏家趙明誠為例[7]

 

薄霧濃雲愁永晝,瑞腦銷金獸。
佳節又重陽,玉枕紗廚,半夜涼初透。
東籬把酒黃昏後,有暗香盈袖。
莫道不銷魂,簾卷西風,人比黃花瘦。

——李清照,〈醉花陰〉

 

這首充滿思念之情的詞,出自北宋著名女詞人李清照(1084–?),傾訴的對象,應該是她的丈夫趙明誠(1081–1129)。來自宰相之家的趙明誠,從太學生時期便常到大相國寺的市集購買碑拓、古器,回家與李清照一同欣賞把玩。

 

圖3:趙明誠於《集古錄跋尾》後之題跋,圖片來源:故宮書畫典藏資料檢索系統 https://reurl.cc/vkoXLN

 

臺北國立故宮博物院有一件《集古錄跋尾》,後方有趙明誠的三段題跋,可知這幾幅歐陽修的真跡曾經在趙明誠的收藏中。題跋寫就的時間分別是西元1106、1116、1118年(圖3)。寫第一則題跋時,趙明誠還在京師,不久因為朝廷政爭而返回山東青州,在家鄉長住,第二、三段題跋便寫於此。趙明誠編寫的《金石錄》,可說是二、三十年收藏生涯的歷程記錄,有入藏的藏品清單,有朋友間的意見交換,也有相關的軼事趣聞。《金石錄》這本書讓我們進入以趙明誠為主的收藏世界,一窺北宋晚期名士才子們共同追求的藝文興趣。

作為一位研究者兼收藏家,趙明誠對自己的藏品充滿了自豪與驕傲。當時的名品,如:石鼓文、秦詛楚文、秦始皇刻石,無一不在趙明誠的收藏之中。其中,泰山刻石的拓片讓他特別自豪,就算是前輩歐陽修(1007–1072)的藏品也不及他。因為之前流傳的本子僅存秦二世的詔文,他的還有秦始皇封禪泰山的詔書,首尾最完整。這個本子得來不易,是他的好友劉跂親自登上泰山,將碑石四面摹下相贈,因此與眾不同。由此可知,要成為一名公認的大收藏家,除了要具備才識與財力,還必須有良友相助。

《金石錄》中記下許多朋友間互通有無的故事。有一次,趙明誠得知河南南部有一個漢代石獸,肩膀上刻著「辟邪」兩字,於是拜託在當地為官的董之明幫忙。經過數年的訪求,董之明總算得到拓片,而且除了「辟邪」,還有「天祿」二字。這一對名為天祿、辟邪的神獸,原來是矗立在一個大墓前方的。董之明還告訴他,天祿石獸近年已經被當地村民所毀,拓片再也無法取得。他寄給趙明誠的銘文,是當地人士多年的收藏,十分珍貴難得。就這樣透過八方朋友的相助,長年居住在山東的趙明誠,也能夠取得京師、四川、河南等遠方各地的石碑拓片。

趙明誠的收藏家朋友有哪些人?我們可以閱讀《金石錄》全書,一一抄錄這些人名,也可以利用臺大數位人文研究中心開發的「詞夾子」工具進行檢索。比較謹慎的話,可以兼用兩者:先翻閱書中人名,再用詞夾子來檢驗。詞夾子的原理是利用構句規則來夾出不特定的語詞,因為相當實用,被整合到一些文本分析的平台上,此處以「碼庫思MARKUS」平台來說明。碼庫思是歐洲漢學研究者衛希德(Hilde De Weerdt)團隊所開發,主要作為文本標記(tagging)之用,碼庫思最大的特色是結合人名、地名、職官等資料庫,自動標記使用者匯入的文本。使用者也可以手動標記,或是利用詞夾子擷取出想要的語詞再進行標記。系統也提供其他的文本分析工具,例如相似性分析。

以《金石錄》為例,趙明誠提到收藏家時,經常出現「藏⋯⋯氏」、「藏⋯⋯家」,利用這個寫作規律,我們可以夾出介於「藏」與「氏」、「藏」與「家」之間的語詞,很快找出書中提到的收藏家(圖4-5)。

 

圖4

圖5

圖6

 

詞夾子自動擷取出的二十多位收藏家中,有些活動年代較早,明顯是前輩,趙明誠是在追述藏品流傳時提到他們,可利用「舊藏⋯⋯家」找出這些人(圖6)。

詞夾子夾出的收藏家,可以標記起來,接著利用碼庫思平台上整合的「中國歷代人物傳記資料庫(China Biographical Database,簡稱CBDB)」,一一檢視這些收藏家的活動年代與仕宦經歷。逐一檢視後得知,這些人中除少數為前輩藏家,多半與趙明誠有直接交往,彼此構成一個以趙明誠為中心的收藏圈子。

如何呈現這個收藏圈?傳統是徒手繪圖或利用繪圖軟體手動繪製,在今日的數位時代,已經有開放資源(open source)的社會網絡分析工具(Social Network Analysis,縮寫SNA),可以讓使用者輸入人際關係資訊,自動生成網絡圖。本文使用的是Gephi,生成的圖像較美觀。圖7是趙明誠的收藏圈,以他為中心,周圍是他的收藏家朋友們(不含前輩藏家)。

 

圖7

 

這些士大夫除了金石收藏的共同興趣,彼此之間經常還有著師友、同鄉、同年或同僚的情誼,在仕宦浮沈中,或彼此援引、或相互攻訐,收藏只是他們人際交往中的一個面向。前面提到的「中國歷代人物傳記資料庫」整理了古籍中提到的人際關係資訊,利用這個資料庫,我們可以檢索出士大夫的一般交往情況,特別是前述的師友情誼與仕宦互動。

將趙明誠與《金石錄》中提到的收藏家一一輸入到資料庫中,查詢出每個人各自的人際關係。再將這些關係資料匯入Gephi,可以得到如圖8所示的網絡圖,顯示這二十多位收藏家、他們的人際關係、以及彼此重疊交錯的情況。圖中的紫色粗線為《金石錄》中直接提到的收藏家(即圖7,含前輩藏家),代表收藏關係;淺色線條則是來自資料庫的記錄,代表一般性的人際交往,可視為背景網絡。

 

圖8

 

接下來的工作就是解讀網絡圖。圖中有些人物節點特別大,網絡線特別多,可能是因為他們在收藏圈中特別重要,如北宋四大書法家之一的米芾;也可能是因為他們留下的文獻特別多,如蘇門四學士之一的晁補之。接著再檢視社會網絡軟體提供的統計數字,中介中心度(betweenness centrality)最高的人是:晁補之、劉跂、米芾,代表他們可能在網絡中扮演重要的橋樑功能,中介不同的群體。這些訊息指引下一步的研究方向,我們可以在文獻中耙梳這些人物的生平與收藏事蹟,衡量他們在收藏圈中可能扮演的角色。

以上數位分析工具對人文研究有何幫助?首先,社會網絡軟體將人際關係視覺化,容易閱讀。其次,當我們從《金石錄》擷取出數十位收藏家時,接下來要從哪些人先著手?過去我們只能仰賴研究者個人透過大量閱讀,對這個時代產生的理解與印象,現在社會網絡分析工具提供另一個具體的參考,指引進一步的研究方向。

趙明誠的《金石錄》不是特例,從十一世紀中葉開始,收藏金石拓片成為不少士大夫的共同嗜好,每個世代都有不少人投入,彼此交換意見與藏品,並且留下記錄。除了《金石錄》,還有數本收藏圖錄也流傳至今,我們可用同樣的方法一一重建這些收藏圈,比較各收藏圈的特點並勾勒長期的發展。

圖9除了趙明誠的收藏網絡,還加入另外兩位同時期的收藏家網絡:董逌與黃伯思,將這三個收藏家網絡整合呈現。有別於趙明誠的長期居鄉,董、黃二人都在宋徽宗的朝廷貢職,整理宮中的古銅器收藏。從圖中可知,董、黃二人雖然是同事,但各有交友圈子,彼此間沒有重疊的收藏友人。其中董與趙明誠的關係比較密切,連接二人交友圈的網絡線比較多。有些人出入三個收藏圈,扮演橋樑角色,當中最重要的是米芾。過去我們知道他是活躍一時的書法家、畫家,原來他在北宋藝文圈中所扮演的中介角色也不可小覷。

 

圖9

 

值得注意的是,雖然董逌、黃伯思二人同時在宮廷任職,但圖9所顯示的卻是趙、董二人間的網絡線較緊密,二個收藏圈的關係較密切,而黃伯思則與他們較為疏遠,為何有此現象?是網絡圖的偏差還是應該納入其他歷史因素?

若回到北宋晚期的士大夫圈子,我們知道,對立嚴重的新舊黨爭對當時的朝政影響甚鉅,幾乎沒有人可以置身事外。逐一檢視網絡中的收藏家發現,董逌與趙明誠的收藏圈中不乏舊黨人士或是親近舊黨者,兩人的政治立場比較接近;黃伯思則與新黨交往密切,與董、趙較為疏離,這可能與他的祖父是活躍的新黨中人有關。如此說來,收藏不僅只是收藏,還是文化發言權的競奪,且強烈受到個人政治立場所左右。[8]

未來要生成美美的網絡圖一定越來越容易,除了觀察網絡的整體型態、網絡線的疏密、個別節點的位置之外,只有儲備足夠的專業領域硬知識,才可能解讀出圖表背後可能的多重意涵,作出合乎歷史脈絡的判斷與解釋。

 

三、數位時代的人文研究工具

 

上世紀九〇年代以來,已經累積了大量的電子化文本,如何讓這些文本發揮其數位特性,做出有別於過往的研究與應用,這是當今所面臨的挑戰。上述北宋收藏圈的研究,在取得電子文本之後,利用一些近年新開發的數位工具,輔助閱讀、擷取資訊、產生視覺化圖表進行分析。

今日人文研究常用的工具包括:詞夾子檢索、標記、詞頻工具、地圖工具與社會網絡分析工具。這些工具中,前三個屬於文本工具,廣泛用來探勘文本的內容與特性。地圖與社會網絡工具則將訊息轉為視覺化圖表,以供圖示與分析。這些工具都不算太難入門,以下略作說明。

 

檢索

數位文本的好處多多,一般人最熟悉的是以關鍵字進行全文檢索,這算是基本款的檢索。將想要查詢的字詞輸入,讓電腦比對出相同或相關聯的結果回報。許多查詢系統中有進階關鍵字檢索,也就是在特定資料欄位中比對關鍵字詞,如:圖書館系統中的書名、叢書名、作者等。利用關鍵字進行檢索之前,使用者必須先知道想搜尋的特定詞彙,無法在不知任何詞彙的情況下大海撈針。

今日數位時代的檢索已經超越關鍵字,使用者可以利用文法或構句的規則來撈出不特定的字詞。以符號為例,雙引號「」常被用來表示對話內容,我們可以用這個規則找出文本中的人物對話,如以『黛玉曰:「⋯⋯」』來找出《紅樓夢》中林黛玉所說過的話。又如書名前後常有符號《》,我們可以用這組符號找出文本中提到的所有書籍。上述《金石錄》研究則是以「藏於⋯⋯家」來找出書中提到的收藏家。這個檢索方式稱作「詞夾子」,由臺大數位人文研究中心的工程師所開發,在該中心建置的DocuSky平台或是前述碼庫思平台上皆可以使用。

詞夾子有別於關鍵字檢索之處在於,過去使用者必須對文本有一定的熟悉度,才有辦法列出關鍵字進行搜尋。詞夾子彌補了這個缺點,使用者只要瀏覽文本,掌握住構句規則後,便可搜尋出一連串屬性相近的不特定詞彙。因為找出來的詞彙是不特定的,有些或許超出使用者原本的預期,讓他(她)對這個文本產生不一樣的認識,因此詞夾子也作為資料探勘(data mining)的一種方法。在數位資料海量劇增的今日,如何從中探勘出關聯性強的有用訊息是近年發展的熱點之一。

 

標記

這是一個當今廣泛應用的功能,各位可能都曾在社群媒體的貼文或照片上標記過朋友。用在數位文本時,標記讓使用者可以一邊閱讀文本、一邊對內容進行註記,就像用螢光筆在書上畫重點一般。不過標記比起用螢光筆畫重點更棒,因為它可以由讀者加上屬性或說明成為標籤,例如:標起來的這段文字是屬於人名、年代、地名,還是事件等,然後再就這些標籤的文字內容進行整理、分析。經過標記的文本,從原始的電子全文(full text)變身成為資料(data),分析價值更上一層,數位全文只能閱讀、複製與拷貝,經過處理的資料則可以進一步作統計與運算。

針對中文文本的標記工具,以前面提到過的碼庫思為代表。這是一個閱讀與標記的平台,不是資料庫,使用時需自行匯入數位文字檔,作業系統建議使用Google Chrome。平台整合了幾個常用的辭典與資料庫,包括:中國古代的職官、古地名、人物傳記。如此一來,當閱讀古文獻時,遇到古代官職、人名字號、地名時,便可隨時點選一旁的查詢按鍵,搜尋出這些名詞的定義,不必在各資料庫視窗間頻繁切換。

碼庫思的標記功能有自動與手動兩種,系統內建的自動標記,以內部整合的人名、朝代、地名、職官等辭典去比對文本,進行標記。手動標記則由使用者按個人需求逐一標記,或匯入關鍵字批次標記,也可用上述的「詞夾子」從文本中「夾」出關鍵字進行標記。結果可統整匯出至其他工具軟體進行下一步分析,例如上述《金石錄》的研究中,將標出的人名匯入社會網絡分析軟體進行考察。

 

詞頻工具

用來計算文本中的詞語出現頻率,例如N-gram,上面第一節圖1、2就利用Google開發的詞頻工具,在Google Books中計算字詞的出現頻率。簡便的中文詞頻計算工具有「中國哲學書電子化計劃(C-text)」網站上的工具,這是一個資料庫,收錄大量中國古代文獻,不過使用時要小心,因為許多數位文本是由電腦自動辨識軟體所產生,沒有經過校對,錯字很多。這也是一個平台,內建一些常用的文本工具,包括:詞頻、文字雲、正規表達式檢索、相似性比對等,使用者可以使用資料庫的文本,也可以匯入自己的文本。

詞頻功能有何用處呢?它顯示一個文本經常出現的語彙,經常被用來分析文學寫作風格或思想觀念的發展。以《紅樓夢》為例,有研究者分析前八十回跟後四十回的用語,發現前、後常用詞語有明顯差異,文字風格截然不同,支持過去紅學學者認為後四十回不是曹雪芹原作的看法。[9]

 

地圖工具

日常生活中我們每天都在使用地圖工具,在Google Map上尋找餐廳、咖啡店,開車時輸入目的地讓它替你規劃路線,或是連假上路時查看高速公路的即時路況,這些都是地圖工具的日常使用。

在教學、研究與專業場域中,最重要的是地理資訊系統(Geographic Information System,縮寫GIS)。這是一種結合測繪地圖、航空照相、衛星影像資料進行地理空間分析的工具,使用者收集分析對象的地理訊息,通常是經緯度座標資料,匯入地理資訊系統,再以帶有訊息的地圖或影像作為底圖,如:水文圖、等高線地形圖、行政區劃圖等,進行空間分析。

過去由於電腦專業軟體的費用高昂,加上合適的底圖取得不易,一般使用者只能望之興嘆。近十多年,出現開放資源的免費軟體QGIS,以及一些平易近人的地圖工具,如:DocuGIS、CARTO,都讓使用者可以很快畫出分佈圖、熱區圖、行程圖等。底圖方面,Google地圖與開放街圖(Open Street Map)都可免費取得,一些公立機構也在網路上釋出各種圖資供教學研究之用,例如中央研究院地理資訊科學研究專題中心的《中國歷史地圖集》與《臺灣堡圖》圖資。以上種種都讓地理分析的門檻大為降低。

除了一般的測繪地圖,Google Earth將衛星圖與航空照相疊加在地球的三度空間模型上,讓使用者可以從高空探索整個地球。你一定沒想到,有研究者在Google Earth上,放大再放大,仔細觀察找出秦漢的長城與烽燧(烽火台)遺跡,辨識出一些過去沒有被注意到的長城遺址,並重建出古代烽燧的佈局。[10]過去的長城研究主要靠人為的踏查,人眼不容易注意到分佈範圍廣大但不明顯的遺跡,但若將觀看的距離拉大,從高空往下看,這些遺跡便變得明顯起來。高空俯視與地面觀測兩者所能看到的很不一樣,Google Earth提供了有別於人眼觀測的一種觀察視角與尺度。

 

社會網絡分析工具

顧名思義用來分析人際網絡關係,知名的「六度分隔理論(Six Degrees of Separation)」便是一種社會網絡分析。這個在上世紀六〇年代提出的理論認為,要將世界上互不相識的兩個人相連,最短的距離只需要六步(圖10)。2006年2月5日臉書發佈的研究則縮短到4.57步,也就是說,在臉書世界中,只要透過3.5個中間人,就能連到遠在天涯海角的陌生人。[11]

 

圖10:六度分隔理論圖示,圖片來源:https://reurl.cc/qkoX23

 

社會網絡分析將人際關係拆解到最基本的點與線,點是個人,線是連結人與人之間的關係線,抽象的人際關係於是被轉為具象的網絡圖,藉此觀察人與人之間、人與群體之間的關係。現在有方便的軟體可供使用,只要輸入點線資料,便自動生成社會網絡圖。講求簡便的,直接在Excel中安裝插件NodeXL即可;對美感要求比較高的,可安裝開放資源的Gephi,上述趙明誠的收藏網絡便是利用此功能優異的免費軟體。

要繪出網絡圖,首先必須有人物節點與連接這些人物的關係線,這些點、線資料如何取得?在社群媒體中,加朋友的二人之間便產生一條關係線,最為直觀;在一個社會群體中,可以用問卷的方式取得,採用受訪者的自述;那麼過去的歷史人物呢?只能由研究者按研究目的自行整理留存的史料。現在學界有一些歷史人物傳記資料庫,也建置人物之間的關係,如前述的「中國歷代人名傳記資料庫」,不過須留意的是,人物關係何其浩瀚無涯,要在文獻中完整擷取出這些訊息是不可能的,使用者可以從資料庫管窺古人的人際網絡,但這圖像是不完整的,有缺漏的,這點必須留意。

社會網絡分析除了用在人類社會,也可以擴大到其他可以被拆解成「點」與「線」,具有「網絡」特性的材料。Nature曾發布一個澳洲的生態永續研究,從樹木與螞蟻之間的相互依存關係出發,探討當螞蟻消失時,如何連帶使樹木瀕危,造成生態危機。[12]在這個研究中,樹種被當作網絡圖中的人,一種樹木一個點,不同的樹種之間若受益於同一種的螞蟻,彼此間便產生一條關係線,如此可以產生樹與樹之間的網絡圖。接著將螞蟻逐一從網絡圖中去除,當只有幾種螞蟻消失時,生態網絡還能存在,一直到某個臨界點,網絡裂解崩壞,生態再也無法持續。

數位時代的今日,工具是如此之方便,一張美美的網絡圖三兩下便完成,若是回到前數位時代,在紙上點出人物、拉出人物間的關係線,是多麼大費周章的一件事,若非胸有成竹,不會輕易嘗試。工具發達的今日,你我都可以快速畫出網絡圖,比拼的點就在於解讀、詮釋、應用的功夫了。可以想像,未來世代學習的重點之一會是如何閱讀這些視覺化的圖表,不是望文生義的想當然爾,而是能結合既有知識的合理解讀。

 

四、結語

 

近十多年,數位科技以飛快速度向前,大數據、機器學習與人工智慧成為流行術語。最近大學中的熱門話題是ChatGPT,這個聊天機器人可以迅速生成流暢自然的文字,讓抄襲防不勝防,自去年十一月發佈以來,許多國外大學已經明令禁止學生使用。至於臺灣的大學,不但沒聽說要禁用,據報導有的學校還研議要統一採購付費版,整體看來比較是朝著鼓勵學生駕馭人工智慧的方向。

AI來勢洶洶,相信不久也會襲擊大學以下校園,對中、小學可能有哪些影響?不如拿這問題來問問ChatGPT,這是它的回答:

 

圖11

 

看起來前景一片光明大好,顯然AI也懂得自我推銷。只好再問問可能產生的負面影響,這是它的回答:

 

圖12

 

這兩則AI自己生成的正、負面影響列表雖然有些制式,不過也點出了目前普遍的期待與擔憂。

未來的教學勢必無法迴避人工智慧。在數位時代,科技工具的使用門檻越來越低,要生成「看起來」有模有樣的圖表或文字,越來越只是彈指之間。如何將這些看來有模有樣的生成物變成黃金?若從數位與人文交涉的歷程來看,最終仍將回到學科專業能力。數位的速度越快,學科知識也要越深越廣,光靠個人也許力有未逮,相揪前行可能會是未來的趨勢。

後記:本文應邀為國民中小學課程與教學資源整合平台《非常好社》刊物所撰寫,同步刊登於該刊第十六期。

 

 


註解

[1] http://wiki.teldap.tw/index.php?title=%E9%A6%96%E9%A0%81

[2] 數位人文的定義與發展過程,見項潔、涂豐恩,〈導論:什麼是數位人文〉,收入項潔編,《從保存到創造:開創數位人文研究》(臺北:臺大出版中心,2011),頁9-28;林富士,〈「數位人文學」概論〉,收入林富士主編,《「數位人文學」白皮書》(臺北:中央研究院數位文化中心,2017),頁2-11;林富士,〈為而不有的志業〉,收入林富士策劃,曹銘宗撰稿《遠見與承擔:中央研究院數位人文發展史1984-2015》(臺北:中研院數位文化中心,2017),序,此文網路版見《歷史學柑仔店》,2017年11月https://reurl.cc/9VxyAj,2019年10月18日查詢。

[3] 參教育部大專院校一覽表,https://reurl.cc/Q4mDAq,2023/3/12檢索。

[4] 參行政院國家資訊通信發展推動小組等撰稿、財團法人資訊工業策進會編輯,《數位學習白皮書》(臺北:經濟部工業局,2005),https://reurl.cc/Rv8DV6,2023/3/12檢索。

[5] William G. Thomas, “Computing and the Historical Imagination,” in Susan Schreibman et al, eds, A Companion to Digital Humanities (Oxford: Blackwell, 2004), https://reurl.cc/2WN39v, accessed 2019/5/30.

[6] 參行政院國家資訊通信發展推動小組等撰稿、財團法人資訊工業策進會編輯,《數位學習白皮書》,頁41,https://reurl.cc/Rv8DV6,2023/3/12檢索。

[7] 本節內容修改自許雅惠,〈趙明誠與他的收藏家朋友們:數位人文方法初探〉,《歷史學柑仔店》部落格,2017.11.24發表,網址連結:https://kamatiam.org/趙明誠與他的收藏家朋友們/。完整研究見許雅惠,〈北宋晚期金石收藏的社會網絡分析〉,《新史學》,第29卷第4期(2018年12月),頁71-124。

[8] Ya-hwei Hsu, “Antiquaries and Politics: Antiquarian Culture of the Northern Song, 960–1127,” in Alain Schnapp et al eds., World Antiquarianism: Comparative Perspectives (Los Angeles: Getty Research Institute, 2013), 230-248.

[9] 杜協昌,〈利用文本採礦探討《紅樓夢》的後40回作者爭議〉,《數位人文研究與技藝》(臺北:國立臺灣大學出版中心,2014),頁93-120。可參https://reurl.cc/0EQnMl,2023/3/3檢索。

[10] 邢義田,《Google地球與秦漢長城》(臺北:三民書局,2022)。

[11] https://reurl.cc/4Qq8VK,2023/3/11檢索。

[12] https://www.youtube.com/watch?v=xZ3OmlbtaMU,2023/3/11檢索。


本文採用 創用CC 姓名標示非商業使用禁止改作 3.0 台灣版條款 授權。

歡迎轉載與引用,但不得為商業目的之使用,亦不得修改本文。轉載、引用本文請標示網址與作者,如:

許雅惠/在數位時代研究歷史
引自歷史學柑仔店(https://kamatiam.org/在數位時代研究歷史/)


最後修改日期: 2023-04-08

留言

真理大學設「人文與資訊學系」,但根據該系課程規劃(https://ddh.au.edu.tw/p/412-1033-104160-1.php?Lang=zh-tw),「本系以人文素養的基礎課程為基底,輔以行政、文化、行銷與資訊應用等專業課程的訓練,培養出具有文案行銷、策展企劃、數位設計與實務創作的專才」,跟數位人文是完全不同的。

    作者
    歷史學 柑仔店 

    您好:
    該系所定位如何,我不便代為回答,不過它的英文的確是Department of Digital Humanities,是台灣唯一以DH為名的系所。
    數位人文範疇寬廣,有的偏數位、有的重人文,有純學術研究、也有實務應用。雖然如此,數位人文在結合科技與人文之外,還有一些共同特點,包括:跨學科合作、開放共享、使用者導向等。另外,也有人提倡跨越知識生產與消費之間的鴻溝,帶有公眾史學的色彩。在教學方面,一個新領域落實到系所教學時,會有師資培育的問題,因為它與過去傳統的學術分門不同。總而言之,這個領域目前正在發展中,有很多不同的可能性,我想可以用比較開放的態度看待。

發表迴響