2015年4月21日 星期二

國家數位典藏計畫三年12億做了什麼?

原始發布時間:05 十二月, 2005 18:54

賣電腦原本不是資訊月電腦展的本意,但大家都知道的,電腦展早就成為一年二度的(另一次應該算是暑期電腦展)集中攤販市場

今天去逛了一逛,除了看叫賣的show girl辣妹之外,還是不忘去看看政府的e化成果展。這一大塊較為冷清的一區,其實才是資訊月電腦展的本意。

不過,一到「數位典藏區」,讓我LP又開始燒火了。

或許有人不知道什麼是「數位典藏」計畫,但我很樂意幫政府宣傳一下這「政績」。
簡單說,這是從91年開始展開的國家型計畫,其主要目標是要把國家的重要文化資產數位化。從91至93年,這個計畫預算總計達12億。

你可以想像或者思考一下,這麼美麗的計畫可以得到什麼樣的結果?

例如,以國家圖書館的「國家圖書館國家典藏數位化計畫網站」(這可是近來很熱門的議題啊!Google、MSN、Yahoo都積極在投如數位圖書館計畫)為例,你覺得你可以得到什麼樣的成果呢?

到了攤位,我看到了二合一的光碟,原來這是珍藏善本的數位化版本,裡面一片是故宮的,一片是國家圖書館的。於是請解說員幫我開啟了國家圖書館的那篇。我原本想,在這片CD裡可以讓我看到一整套的「十三經」或是「二十四史」的,結果呢?原來是之前國家圖書館曾出版的一本類似藏善本的導讀與介紹的書,然後他們把這本書掃成圖檔,再把介面設計得很難用滑鼠翻閱的電子書。

接著解說員向我解說了數位圖書館的網站。我問他,我想看十三經,有沒有?若沒有,二十四史也行?她說:我們是以善本書的數位化為準,這幾套書不見得有善本,也不見得在計畫內。然後我又問,有沒有一本論語的善本書讓我看看?這麼普及而有名的書,總不可能沒有吧!他於是到了圖書館裡搜了搜,跟我說,旁邊有圖像(icon)的就是有,我請他點一本來看看。結果點不進去,據她說:這必需到國家圖書館內才能看。我又問,這書是圖檔嗎?她說,是的。我又問,我要搜尋裡面的內容來用來讀怎麼辦?……………


如果前面長篇大論你看不下去,這裡簡單說吧:花了十二億了,但你說我要拿本論語的電子書來讀有沒有呢?答案是沒有。(她還補充說:外面有太多這種電子書了,但我反問,所以結果是國家圖書館完全不提供論語?也找不到論語?只因為外面很多人有論語了?)

當然,這不是眼前的這個可愛熱心又美麗的小女孩的錯,我還得感謝他的詳細解說。最後離開時,我跟他說聲抱歉:不好意思,讓你倒霉遇到我這麼龜毛的民眾。

回到辦公室之後,我聽說,故宮是做得不錯的一個單位。於是到了故宮的「數位典藏系統之研製計畫網站」搜搜,結果,搜尋介面還頗有Google簡單風格,不過搜尋結果你可不用期待會比Google豐富。

我搜了搜「田黃」,結果只找到一顆清代的,照片又小又難看,還不如去看看我朋友送我的一堆圖檔。然後搜了蘇東坡,結果是沒有結果;我不信,記得以前去故宮時曾看過很多老蘇的書畫作品。想了想,換了「蘇軾」,皇天不負苦心人,終於讓我搜到了一個作品。

整個計畫成果在這裡。或許,我忽視了什麼。但至少,就我所一直長期在關心的數位圖書這個領域,我是很失望的。

最後,但願不會有人跳出來說:論語和故宮文物都是中國的,不是我們的文化資產!

原始發表回應
突然想到,
最近紅的發燙的簡立峰先生就是負責數位典藏人員之一...
http://tw.money.yahoo.com/edu/col/new/2006/03/31/winwin/28087.html

到底這個計畫做了些什麼呢...
身為一般人的我實在不明白阿。
路人乙 回應於 21 五月, 2006 08:15


一個內外都不是的人 [回覆]


我不是參與者, 但因為最近是圖書館的學籍, 加上工作的關係, 說沒碰到這個也是不可能...

這方面要從三方面來看..

1. 這個計劃是有必要執行的, 我想8成的人會同意.

2. 這個計劃目前成果的方向是對的, 此時同意的人會降到6成.

3. 這個計劃所投入的資源是符合成就與結果的, 可能就不到4成的人會同意.

而我可能是第一百分百贊成, 第二部份是5成, 第三點就可能連2成不到的懷疑論者, 其中的確也包含A-J 跟 與之 所說的這件事, 這樣的專案, 用這樣執行可能四成的公帑就這樣浪費掉...

但就一個圖書相關領域的工作者, 與網路工作者, 也只能希望盡量有效率的做好有價值的事, 雖然這是不太可能, 只是還是有不少工作者是值得鼓勵的...
黑貘 回應於 22 四月, 2006 23:47


鐵飯碗 [回覆]


幹...
ddd 回應於 21 四月, 2006 03:39


[回覆]


先釐清一個觀念
「數位典藏國家型計畫」!=「數位圖書館」。數典包含但不僅只有數位圖書館概念。

此外,二十五史、十三經全文已經在網路上找的到了,不必重複花錢。國圖、故宮把資源投入在前人沒有作過的善本掃描、相關紀錄分析處理上。不僅僅圖書;書畫、器物、生物、科技等領域都是數典的範圍。

數位典藏另外一項意義,就是不僅僅是在所謂藏品的數位化上,更是對所謂藏品的相關資訊--後設資料(metadata)作保留與整理,以待"後日"串連、分析、搜尋之用。

希望在一些資訊交流上能充分溝通,讓研究者、教師與民眾都能多少享受到成果。
marxwang 回應於 19 二月, 2006 11:37


嗯嗯 [回覆]


朵與BJ的討論是不會有交集的,就像Yahoo的搜尋引擎做的再仔細再精美,它跟Google比起來就是少了那麼一點合我的味道。Google的目標是方便所有人找到想要的資訊,那我們的數位典藏計畫是為了收藏,高下立判。有人說網路上到處都可以找到論語的內容,那沒錯,所以BJ你可以再等等,再過不久,你就可以在Google上找到你想要的「數位典藏」了。
dpan 回應於 18 元月, 2006 23:22


數學的算法 [回覆]


如果真的有115成果產出,12億除115成果除3年=約340萬
也就是說每產出1個成果,一年要花約340萬,而3年來政府花3*340萬=約1000萬。
檢視每個成果,真的值那麼多錢?
erlking 回應於 10 十二月, 2005 11:32

逛了一下,科學類的還不錯啊 [回覆]

文史文物類的雖然有點失望
但是逛了一下科學類的典藏網站
內容都還不錯啊
也是不能全盤否定吧
droger 回應於 03 元月, 2006 13:55


參考一下民間團體的數位典藏計畫 [回覆]


大概在七年前我參加過的一個專案,
雖然也有領政府的輔導預算, 不過我覺得積極度完全不同...
目前數位圖書館比較頭痛的問題應該是版權吧~~~ 技術已經相當不錯了~~~
http://www.lib.nctu.edu.tw/
上面是浩然數位圖書館網站, 我個人覺得是國內數位圖書館作得比較成功的~~~
Richie 回應於 09 十二月, 2005 17:04


誰相信政府做事情會好到去 [回覆]


樓上講的對
鐵飯碗就是這樣
原則上政府機關每年編列預算給各單位, 目的就是讓各單位去消化這些預算, 既使沒有計畫也要想辦法弄點名目出來, 不然下年度就會沒有扣扣入賬, 相信這點大家都知道 ....
改革改革, 都把錢改到自己的口袋去了...
要想辦法逃稅才是 ...
A-J 回應於 09 十二月, 2005 03:01


數位"典藏"計畫 [回覆]


也許這就是國家數位"典藏"計畫,重點在典藏,不是數位,我研究所老師也是有接此案的子計畫,但是政府的專案就像地方政府鋪路一樣,鋪好就不管了,接下來的修路,維護,挖地下管線之類的工作就各行其事,重複浪費.最後,各個研究單位在不多事的心態下,把錢花完就了事了.
Jobban 回應於 06 十二月, 2005 18:37


只是路人的想法(5) [回覆]


關於推廣
想必BJ是聽完那位可愛的展場小女孩的解說才有這些感想.而且我發現一般去參加展覽的觀眾真的很難能得到對於數位典藏計畫詳細而完整的資訊與成果.
這得要分很多層面來說:首先,數位典藏計畫是由全國各種大小不同層級的單位一起進行的,每個地方視他們的能力來調整數位化的進程,在房子還沒有蓋好之前,真的很難可以開放給一般人查詢使用.(如BJ所提到的,根本找不到國家圖書館論語或是其他數位典藏資料庫的出處.)
第二:就算是已經達到基本架構建設完成的資料庫而言,也會針對不同資料採取不同開放程度的政策.有些資料庫能開放的僅只限於少數,如果有進一步的需求,還需要到該單位所允許的網域中使用.這一點在國際上早就行之有年,不是只有台灣這麼做.
第三:基於以上兩點,的確是很難讓非相關工作從事人員了解數位典藏的成果究竟是什麼?畢竟像國家型計畫這種東西,真的很難像BenQ或是Sony這種大公司大品牌一般地做行銷.就算要國科會主導的學者出來展場解說,我想一般觀眾也不會賞光.事實上,除了大家比較熟悉的國家圖書館和故宮之外,其他進行數位典藏的單位,多半屬於學術性的研究機構,這些資料是否可對於一般人產生立即的需求或是如百貨公司商品這樣的吸引力,恐怕是相當困難的!
最後,附上幾個網站:也許可以彌補那位展場上負責解說的女孩的不足,這也是數位典藏計畫所缺乏並應該要改善的!

(1)數位典藏國家型科技計畫http://www.ndap.org.tw/
(2)已開放一般人任何ip的數位典藏資料庫成果http://antiquities.npm.gov.tw

順道一提,要找到這些個別的資料庫,還真是需要費一番工夫,要改善要改善!!
朵 回應於 06 十二月, 2005 14:01

By the way, [回覆]


續上篇,
第二個網址http://antiquities.npm.gov.tw

它只收納了器物文物的資料,那個很有名的蘇東坡書畫,是沒有被登錄在這個資料庫中的.
資料庫的性質也直接影響了你想要查詢的對象.

補充說明,以上.
朵 回應於 06 十二月, 2005 14:13

看熱鬧的路人 [回覆]


這個問題為什麼引起這麼大的迴響?
真有這麼多人使用過這些服務跟聽說這些說明唷?
聽起來,應該請iThome還是數位時代追蹤報導一下到底政府的這些e化經費,都拿去做了些什麼吧

還真的有人關心呢
與之 回應於 06 十二月, 2005 15:16

也是路人的想法(4) [回覆]


文字可以被打成字碼放在資料庫中,但是其他東西要做保存,例如動植物,地圖,檔案資料,還有信件地契或是藝術品等是一樣可以被數位化的.
要數位化這些資料或者是說某些國家級單位的藏品(不管是何種內容),需要靠的是一群資訊科學人材設計資料結構,電腦資訊工程師開發資料庫系統,以及要數位典藏的學門不同的專業人材的相互合作,才得以完成.
這些工作在我看來,是另外一種形式的十大建設,和單純的"電子書"不一樣的是他們必需要克服各種困難(例如你所言的少用難字缺漏的情況,如何在全文檢索環境下解決並顯示,既然要全文檢索以現行的電腦字碼必定無法照顧到這些缺字),各領域的相關研究人材都投入很多心力精神在這方面.
現在台北市便利的捷運系統,讓大家生活更加方便,但是對住在台北市超過十年以上的人們來說,很難不忘記那段長時間惡劣的交通黑暗期吧??
我想,數位典藏現在的情況應該就是建設的黑暗期,國家數位典藏計畫到今年底才滿四年,一條淡水捷運線都蓋了十年才完成,對於一個即將滿四歲的寶寶,真的很難要求他要寫一手精美的好書法給你看.斷簡殘篇是個過程,如果只是要用到論語的內文,大可以使用各種版本的電子書(中研院的漢籍資料全文檢索和四庫全書全文檢索就相當好用了)這些對著珍本論語(或是其他古籍)進行數位典藏的工作人員來說,他們所面臨到的是,要如何設計資料結構,登錄資料,開發好用的資料庫系統,來方便以後的各種人們使用,這包含了專業的研究者學者,需要寫報告查資料的研究生及大學生,只要知道初步內容的中學生或是一般大眾等等,各種不同程度的需求!真的不是google和電子書只負責把相符合字碼的段落給你找出來就可以解決的.
朵 回應於 06 十二月, 2005 13:39


也是路人的想法(3) [回覆]


不知道大家有沒有用過圖書館網頁上的"館藏查詢"呢??如果沒有用過的話,可以到國家圖書館的網頁上查看.(http://lib.ncl.edu.tw/urica.html)數位典藏的工作所做的,事實上比較接近圖書館的館藏目錄查詢系統.圖書館建立目錄查詢系統時,不會將館內所有的書籍內文都key in進資料庫中(也沒有人想這麼做吧?),只要把每本書的足以辨識的重要資訊登錄在資料庫中,並且加上資料庫資料結構設計的幫忙,需要至圖書館使用圖書的人就可以輕易地在網路的這一端知道某幾本書被放在某些特定地點.但是要使用這本書,要讀它,還是需要親自到圖書館去將它找出來,拿在手上使用.
朵 回應於 06 十二月, 2005 13:17


也是路人的想法(2) [回覆]


數位典藏不是將文字電子化而已!首先,我先定義何謂電子全文檢索的系統:如同fauzty所提及的漢籍資料全文檢索系統,另一項也很好用的漢籍全文檢索是四庫全書的全文檢索系統.這套系統在各大重點大學的圖書館都有購買,但是需要至圖書館內或是特定的網域使用.無法做到像google大神一般的隨處可用.但是這些全文檢索系統是經過專人校定,並有精確的後設資料結構設計(四庫全書甚至在全文檢索後還可以看到原書籍頁面的影像).可以讓需要查資料的研究者及一般人查到他所需要的"特定"的資料片斷.當然前提是,你需要到十三經,二十五史和四庫全書中尋找某些特殊的資料.
朵 回應於 06 十二月, 2005 13:11


也是路人的想法(1) [回覆]


我想,作者誤會數位典藏工作的意義了!就拿文中遇到的情況而論,以國家圖書館善本書為例,數位典藏工作不等於電子化所有的善本書文字,善本書的珍貴是在於不同時代的版本及印刷,而非內文!它被以圖檔方式保存絕對是有其必要性!!而且數位化的資料搜尋方式,也不只限於全文檢索一種而已.
朵 回應於 06 十二月, 2005 12:57


[回覆]


忘記附上網址http://www.sinica.edu.tw/ftms-bin/ftmsw3
fauzty 回應於 06 十二月, 2005 04:35


早就都有了 [回覆]


拜託,二十五史、十三經中研院早就都有了。1997年就已經做了!如果2005年還要花錢再重複做一次,那才叫浪費錢。你要找的論語還有注疏和斷句兩種版本呢。
fauzty 回應於 06 十二月, 2005 04:35

中研院的漢籍資料庫不等數位圖書館 [回覆]


感謝您,我本來也要罵罵這個計畫的,你沒提醒我我倒忘了

這個資料庫我用很久了,他的成就當然我們是不可否定的,

但是這和我所談的是兩碼子事!而且這個資料庫還有很多問題

首先,你要到這個資料庫讀論語可得以到資料庫挖礦的方式挖出來呢!單然啦,我也一直期待中研院的這個資料庫可以快快改成電子書並開放出來,那一天我也問了解說員這個問題,當然從她身上是問不到答案的!

中研院的這個資料庫還有個問題,一些電腦中的古字如果你想看得到,必需安裝他的造字檔。

其實,目前網路上是可以到處得到論語這本書的,我們也可以大致看出,這些書都是從中研院資料庫弄出來的,但因為字碼的問題,讓大多數的電子書都有很多的錯落(有時可用斷簡殘編來形容)。

此外,古書還有版本的問題--也是這些國家圖書館及故宮珍本善書的重要了!這些國家級的單位出來做這件事情時,他們才有真正的資源可以提供外面所無法觸及到的善本。

或者,看看電子佛典計畫(CBETA)你就可以了解我的意思了。

http://www.cbeta.org/index.htm
BJ 回應於 06 十二月, 2005 13:12


[回覆]


嗯,果然是很大的成就,大到論語的文字都不夠格被數位化.
white 回應於 06 十二月, 2005 01:28


[回覆]


什麼叫"鐵飯碗"~~就是這樣啊~~
路人一隻 回應於 06 十二月, 2005 00:59

沒有留言: