2006年3月25日 星期六

25 VS 22

今天總算接續了去年 11 月底的工作,把《二十五種藏經目錄對照考釋》(以下簡稱 25)與《二十二種大藏經通檢》(以下簡稱 22)的資料做了比對,並且把不足的資料補上,主要是補上 25 種不在 22 種的資料,雖然還有不少資料沒有完全確認,但至少大的架構已經完成了。

這裡要說一下為什麼是由 11 月底就停止,因為 12 月開始,就在處理缺字,要發表漢字工具程式。緊接著準備2月要發表的光碟,這些都在1月底--也就是過年前大致告一段落。2 月開始,又在忙 2/18 號發表會的事,包括所有的資料要更新上網,網站也要更新資料。

原本以為 2/18 之後,就可以開始經錄工作。但緊接著而來又是一堆事。主要是新式標點專案在進行中,要改寫新式標點的編輯程式,處理新式標點網頁,以及許多處理新式標點的程式,這些忙下來,又是一個月過去了。前幾天,才終於陸續處理完那些事,接上了經錄專案的正軌,再來一個半月,希望都是屬於經錄專案的。

25 是哪些經目?

宋:開寶藏、崇寧藏、毘盧藏、圓覺藏、資福藏、磧砂藏(甲)、金藏
元:普寧藏、磧砂藏(乙)
明:南藏、北藏、嘉興藏
清:龍藏、頻伽藏
高麗:麗藏
日本:天海藏、縮刻藏(弘教藏)、卍字藏、大正藏
專書:(宋)指要、(宋)標目、(元)至元、(明)義門、(明)知津、(日本/清)緣山

22 則略有出入,相較於 25 ,其所增加的是底下 5 種

唐:開元釋教錄
隋:房山石經
元:弘法藏
明:洪武南藏
民國:普慧藏

捨棄 25 種的底下 8 種

元:磧砂藏(乙)
日本:天海藏
專書:指要、標目、至元、義門、知津、緣山

以上就是這二部藏經目錄專書的概況。

2006年3月24日 星期五

快速變化的時代

這二天的事又說明了一個事實,已經蠻久以來都沒時間好好學一個新的東西,也不太敢為了學新東西而學。電腦書也是一樣,若不是真的很需要,通常也不會為了學習而買,否則可能還沒用上,就已經過期了。更何況網路上已經可以找到不少資料,很少真的需要買書,而真的買下去的,都是大部頭的書。


電腦的領域似乎就是這樣,一切變的太快了,自己都是在真的有需要時,才開始動手找資料,利用過去累積的經驗,再很快的將成果做出來,而工具本身,已經不再是那麼重要了。

測試建立 MySQL 資料表

24 日延續昨天(應該算今天凌晨)的成果,開始自己建立 MySQL 的資料庫,所幸已有 phpMyAdmin,在使用上很容易猜測相關的功能,只可惜主機速度慢了一點,試起來頗花時間。

在測試之前,其實先用了 Access 試做 prototype,這是利用 19 號回新竹及 20 號回來的火車上所完成的架構,也總算把過去的問題一次解決。

Access 測試成功後,就動手在 MySQL 測試,然後再用 Perl 寫 CGI,過程幾乎順利,看來這部份應該沒什麼問題了,只要將資料準備齊全,應該可以在時間內結案。

用 Perl 讀取 MySQL

本來在整理經錄的資料庫,突然被提醒相關的程式動手寫了沒?

其實我先前都是用 Access 在整理資料庫,而實際寫過資料庫相關應用程式,都是用 C++ 或 C# 寫的,這次經錄要發表的是網路版的程式,原本是想到用 MySQL+PHP,但 PHP 沒玩過,結案的時間有點緊,想想還是用 Perl 比較安全。

Perl 雖然寫過一些程式,也處理過 CGI,但卻沒實際和 MySQL 搭配過,在資料庫方面只用過 Windows 系統上的 ODBC,因此昨天就想來試試 MySQL+Perl 的效果如何?尤其我擔心若 MySQL 支援的 unicode 不是 UTF8,就會有麻煩了,因為我只有 Perl 5.6 處理 UTF8 的經驗。

應該算是 3/24 的凌晨,開始動手找 Perl 處理 MySQL 的相關資料,同時也參考了 ray 寫過的 Python 相關程式,在找了一陣子加上不斷地測試,終於利用現成的資料庫試出來了,寫了一支 Perl 讀資料庫的程式,雖然只有短短幾行,也算是踏出成功的第一步了。

最後成功是用 MySQL 模組完成的,而不是一開始試的 DBI,後來也有找到 DBI 相關的資料,但時間有限,就沒再試下去了,試完這些,已經是 24 號凌晨四點多了,已經很久沒熬夜到那麼晚了,不過也算有不錯的成果。