• <code id="komc0"><label id="komc0"></label></code>
  • 2012-07-12 星期四

    農歷五月廿四

    讓中華經典“活起來”——中華書局推進古籍數字化紀實

    日期:2014-06-27   作者:李慧   新聞來源:光明日報

    日前,中華書局研發完成“中華經典古籍庫”第一期數字化成果,完成自有版權的300種共2億字古籍的數字化,包括了中國傳世典籍的最核心部分。這一數據庫將依托全國十幾家圖書館的平臺向公眾開放,讓中華經典躍然屏幕,讓文化真正“活起來”。

    完成這2億字,中華書局用了十年。

    古為今用:傳承中華文化的時代擔當

    打開中華書局“中華古籍數據庫”,黃褐色的界面充滿古典感和文化氣息,左側的目錄欄里,各本古籍按照“經”“史”“子”“集”分類排列,綱舉目張,條理清晰。

    這一數據庫保留了標點、???、專名、注釋等全部整理成果,提供原書掃描圖像頁與數字文本一一對照,公眾將擁有可靠、可直接引用的數字化古籍,實現了中國高質量古籍整理圖書的數字化。

    浩瀚的文字背后,是煩瑣的古籍整理和精細的后期數據加工工作。

    早在2003年,中華書局便成立古籍資源部,開展“中華古籍語料庫”項目的研制開發,當時還完全沒有“數字出版”的概念,古籍資源部主要從事古籍的數字化編輯加工,用6年時間將3億字的整理本古籍做數字化處理,完成了初步的平臺建設和語料積累。

    這些語料積累,源自中華優秀傳統文化和典籍作品。我國浩繁的文化典籍,是中華民族政治、經濟、歷史、文化和民族精神的重要載體。據專家估計,中國存世古籍總計在20萬種以上,如果計入碑刻、家譜等,數量更多。

    “這些存世古籍負載著厚重的中華文明,凝聚著民族智慧,是祖先留給我們的精神遺產。”中華書局總經理徐俊說,弘揚中華民族的優秀文化,為學術研究和廣大讀者提供高質量的基本古籍,是中華書局長期致力的目標。

    內容為王:秉持精益求精的文化品格

    20世紀90年代,古籍數字化開始在我國起步,隨著網絡的普及,古籍數字化迅速興起。

    在古籍數字化欣欣向榮的同時,我們也看到,目前我國古籍數字化在數據質量、數據內容等方面存在諸多問題。個別數字化資源隨意節選,以訛傳訛,對讀者產生了誤導;很多古籍數字出版物沒有獲得合法著作權、網絡盜版猖獗,成為知識發展的重大障礙。

    “在目前的數字出版界,始終存在一種爭議,那就是數字出版應堅持技術為王還是內容為王?”中華書局副總編輯顧青介紹說,“我們在做古籍數字化之前,首先明確了這個問題,確定了"內容為王、質量至上"的原則。”

    對此,徐俊也明確指出:“保證數字產品的合法性和基本質量,是古籍專業社應該做的事,但也正是版權和質量這兩點使得專業社古籍庫產品研發步履維艱。”

    顧青介紹說,由此,我們確定了古籍數字化的幾個基本理念:一是古籍數字化一定要以古籍整理為基礎,做到內容準確;二是古籍數字化產品必須要擁有合法著作權,確保法律上無瑕疵;三是古籍數字化一定要方便讀者使用,讓古籍從書頁中走到屏幕上來。

    攻克難關:打造數字出版的百年老店

    “我們點開右側的"人名信息關聯"功能,輸入"曹操"這個人名,便會出現這個古籍庫中所有曹操的人名、別名信息,這對于學者的研究很有幫助。”中華書局市場部主任翁向紅說。

    然而,外人卻很難了解,在這背后,數據編輯工作人員付出了怎樣的艱辛。

    “這就意味著,編輯人員需要在數據底層把人名、地名、年代等信息都歸納標引出來,再編成可供讀者檢索的程序,這個工作需要有深厚的專業功底,做到專業領先,同時要攻克技術難關。”徐俊介紹。

    為了破解古籍數字化中遇到的難題,中華書局投入了大量精力參與計算機用字規范項目的建設,如“中華字庫”“國家數字圖書館漢字規范處理項目”“新聞出版用大字符集”等項目。“通過這些項目的建設,我們規范了計算機古籍用字,積累了大量的漢字屬性數據,為古籍數字化的工作提供了基礎。也正是有了這些基礎,“中華經典古籍庫”的造字工作才能順利展開。”顧青說。

    為做到數據持續更新,“中華經典古籍庫”計劃每年推出一輯數據包,持續收錄新出版的優秀整理本古籍,在保證質量的基礎上有序擴充數據量,同時不斷進行數據的修訂與完善。

    徐俊認為,未來,古籍數字化需要政府、企業、社會三方面努力,為數字出版營造良好的政策和法律環境,讓優秀中華文化走出書本,得到更好地使用和傳承。

    標簽: 中華經典 中華書局 古籍責任編輯:管理員2

    相關資訊

    亚洲久悠悠色悠在线播放,亚洲欧美日本国产在线观18,伊人亚洲综合影院首页