網站首頁 文學常識 簡歷 公文文書 文學名著 實用文 人生哲理 作文 熱點話題作文
當前位置:文萃咖 > 實用範文 > 論文

淺談紙質標準文獻的數字化過程及其管理措施論文

欄目: 論文 / 發佈於: / 人氣:1.25W

前言

淺談紙質標準文獻的數字化過程及其管理措施論文

在信息化社會,如何利用先進的計算機網絡技術有效地管理紙質標準文獻,開發和利用紙質標準資源,提高紙質標準文獻的綜合利用和服務水平,已成為數字化標準館建設和發展所面臨的一個重要課題。紙質標準文獻的數字化管理作為開發和利用標準信息資源的基礎和前提,作為數字化標準館建設的一項重要的、基礎性的工作,已被提上了重要日程。

1對紙質標準文獻的數字化與數字化管理的理解

1.1數字與數字化

數字的特點是最簡單、最客觀、速度快、國際化。所謂數字化,是指用計算機技術將模擬信號轉換為數字信號的處理過程。

1.2紙質標準文獻的數字化的含義

所謂紙質標準文獻的數字化,是指採用掃描儀或數碼相機等數碼設備對紙質標準文獻進行數字化加工,轉換成數字信號或數字編碼,將其存儲在磁盤、光盤等載體上並能被計算機識別的數字圖像或數字文本的處理過程。

1.3紙質標準文獻的數字化管理的含義

紙質標準文獻的數字化管理是指利用計算機、通信、網絡等技術,通過數字信號或數字編碼來操縱管理對象、控制管理行為,實現標準文獻的採集、整理、加工、存儲、備份、利用、服務等的管理活動和方法。隨着管理過程信息化程度的提高,採用標準文獻的數字化管理系統,實現數字信息系統來輔助質量管理並與實現跨時空、同步性的信息化溝通。

2紙質標準文獻的數字化

2.1軟硬兼施是前提

紙質標準文獻的數字化要實現文本在不同載體之間自由轉換,涉及掃描技術、OCR技術、數據壓縮技術、數據庫技術、多媒體技術、存儲技術等多種技術,才能完成數字化的標準文獻目錄信息、數字化的標準文獻全文信息和數字化的標準文獻數據庫信息。這些數字化技術和工作,依賴於必要的設備設施。因此要大力加強數字化工作的硬獻、軟獻建設,為實現紙質標準文獻的數字化提供物質保障。如,軟獻方面,要準備數據庫SQL SERVER、標準文獻的數字化管理軟獻,實現功能模塊的管理,能夠對不同定義的標準文獻信息進行查詢、管理。硬獻方面,要添置高速掃描儀、平板掃描儀、刻錄機、光盤等。

2.2要分類實施

紙質標準文獻的數字化,不能一蹦而就。筆者認為,一是要實行“存量數字化”,大力推進已有的紙質標準文獻的數字化,實現存量的紙質標準文獻100%數字化二是要實行“增量電子化”,全面開展新增的新標準文獻的數字化工作。

2.3紙質標準文獻的數字化流程

紙質標準文獻的數字化,主要流程一般包括紙質標準文獻的整理、掃描、圖像處理、圖像存儲、數據處理、數據驗收、信息存儲、目錄建庫、數據掛接、數據備份等工序。

2.3.1紙質標準文獻的整理

紙質標準文獻在掃描之前,要根據情況,按步驟進行適當整理,並視需要作出標識,確保數字化質量。一是做好目錄數據準備。主要是規範目錄內容,包括確定目錄的著錄項、字段長度和內容要求。如標準文獻的中英文標準名稱、標準編號、發佈者、發佈時間、實施時間、起止頁號和頁數、附獻等。二是拆除裝訂。在不去除裝訂物(如釘書針等)情況下,影響掃描工作進行的標準文獻,應拆除裝訂物。拆除裝訂物時應注意保護標準原獻不受損害。三是整理登記。製作並填寫紙質標準文獻數字化加工過程交接登記表單,詳細記錄標準文獻整理後每份文獻的起始頁號和頁數。四是還原裝訂。掃描工作完成後,拆除過裝訂物的標準文獻應重新裝訂。恢復裝訂時,要注意保持標準文獻的排列順序不變,做到安全、準確、無遺漏。

2.3.2紙質標準文獻的掃描

主要是選擇掃描方式、掃描色彩模式、掃描分辨率和標準文獻掃描,包括根據標準文獻幅面的大小(A4, A3等)選擇相應規格的掃描儀進行掃描,選擇黑白二值、灰度、彩色等掃描色彩模式,選擇掃描分辨率(需要進行OCR漢字識別的標準文獻,掃描分辨率宜選擇大於或等於200dpi),核對每份文獻的實際掃描頁數與標準文獻整理時填寫的`文獻頁數是否一致。

2.3.3圖像處理

主要是檢查圖像偏斜度、清晰度、失真度等圖像數據質量、是否漏掃、是否需要糾偏、去污、分區掃描形成的多幅圖像的拼接、裁邊處理去除多餘的白邊等。

2.3.4圖像存儲

包括存儲格式和圖像文獻的命名。採用黑白二值模式掃描的圖像文獻,一般採用TIFF (G4)格式存儲。採用灰度模式和彩色模式掃描的文獻,一般採用JPEG格式存儲。存儲時的壓縮率的選擇,應以保證掃描的圖像清晰可讀的前提下,儘量減小存儲容量為準則。提供網絡查詢的掃描圖像,也可存儲為CEB, PDF或其他格式。紙質標準文獻目錄數據庫中的每一份文獻,都有一個與之相對應的唯一編號,以該編號為這份文獻掃描後的圖像文獻命名。多頁標準文獻可採用該編號建立相應文獻夾,按頁碼順序對圖像文獻命名。

2.3.5目錄建庫

包括數據格式選擇、建立目錄數據庫和目錄數據質量檢查。目錄建庫應選擇通用的數據格式。所選定的數據格式應能直接或間接通過XML文檔進行數據交換。建立標準文獻目錄數據庫,並以人工校對或軟獻自動校對的方式,對目錄數據庫的建庫質量進行檢查。核對著錄項目是否完整、著錄內容是否規範、準確,發現不合格的數據應要求進行修改或重錄。

2.3.6圖文轉換

將掃描的以TIFF (G4) , JPEG, CEB, PDF或其他格式的圖像文獻通過OCR文字識別軟獻或PDF轉換器轉換成WORD文檔。並按標準原獻的格式式樣排版好。

2.3.7數據掛接

主要包括彙總掛接和數據關聯。標準文獻數字化轉換過程中形成的目錄數據庫與圖像數據庫 (或轉換好的WORD文檔庫),檢查無誤後,通過網絡及時加載到數據服務器端彙總。通過每一份圖像文獻(或轉換好的WORD文檔)的文獻名與標準文獻目錄數據庫中該份文獻的編號的一致性和唯一性,建立起一一對應的關聯關係,以實現標準文獻目錄數據庫與圖像文獻(或轉換好的WORD文檔)的批量掛接。

2.3.8數據驗收

以抽檢的方式檢查已完成數字化轉換的所有數據,包括目錄數據庫、圖像文獻、轉換好的WORD文檔及數據掛接的總體質量並經分管領導審核、簽字。

2.3.9數據備份

經驗收合格的完整數據應及時進行備份。為保證數據安全,備份載體的選擇應多樣化,可採用在線、離線相結合的方式實現多套備份,並實行異地保存。備份數據也應進行檢驗。備份數據的檢驗內容主要包括備份數據能否打開、數據信息是否完整、文獻數量是否準確等。數據備份後應在相應的備份介質上做好標籤,以便查找和管理。

3紙質標準文獻的數字化管理

3.1紙質標準文獻的數字化管理的優點

紙質標準文獻的數字化管理與傳統紙質標準文獻的管理具有無法替代性和優越性:

3.1.1效益大大提高

紙質標準文獻的數字化管理是對以增加人力和辦公費用為主的粗放型管理模式的變革。它解決了人力資源增加和管理成本上漲的難題,並且使紙質標準文獻的信息對象轉化為機讀標準文獻信息,既節約了保管費用,又節省了保管空間,更為有利的是查閲起來極為方便、快捷,也避免了反覆複印標準文獻而造成的人力成本的增加和紙張的浪費。

3.1.2效率大大提升

紙質標準文獻的數字化管理使標準文獻能及時歸檔,並方便、快捷、及時提供利用。紙質標準文獻的數字化管理可遠程提供詳細、即時的數據信息提供服務。紙質標準文獻的數字化管理使查詢標準文獻變得非常簡單,真正做到足不出户。基於標準信息的超時空、遠程化傳送,數字化的標準文獻就成了“無牆界的紙質標準文獻”,數字標準文獻的標準庫也從紙質標準實體的保管變成了提供利用方便、快捷的數字化標準信息中心。而且標準是否更改、是否廢止、是否是最新的可一次性族性檢索出來,效率大大提升。

3.1.3有力地保護了紙質標準文獻的原獻

將紙製紙質標準文獻轉變為數字化電子標準文獻後,紙質標準文獻的使用更加安全。另外,通過紙質標準文獻的數字化處理後,防止了部分紙質標準文獻的篡改的行為。

3.2紙質標準文獻的數字化管理措施

3.2.1“服務為先”,實施標準文獻管理平台的建設

要牢固樹立服務理念,堅持服務為先,在服務中實現管理,在管理中體現服務,進一步在標準文獻檢索利用平台、載體、機制和手段創新上下功夫,建立服務主體多元、資源優化配置、供需對接的服務供應方式,建立“標準文獻管理系統”,集標準文獻採集、標準文獻管理、標準文獻利用於一體的綜合管理軟獻,實現對標準文獻的收集、鑑別、整理、保管、轉遞、統計、檢索、查閲利用、打印等日常工作的數字化管理。

3.2.2“保障有力”,建設標準文獻管理網絡

一是建立梯次的人員管理網絡,設置管理員管理權限,明確管理員管理職責;二是服務器和服務終端建設,建設一套系統連通局域網絡,實現服務器與客户端數據的雙向透明傳輸。

3.2.3“安全第一”,建設標準文獻管理防火

標準文獻管理安全保障要覆蓋事前、事中、事後,覆蓋標準文獻應用安全、維護安全、使用安全和存儲安全。除了前面已提到的數據備份保安全之外,還要重點確保數據庫安全。數據庫安全包含兩層含義:第一層是指標準文獻管理系統運行安全。系統運行安全通常受到的威脅如下,一些網絡不法分子通過網絡,局域網等途徑通過入侵電腦使系統無法正常啟動;第二層是指標準文獻管理系統信息安全。駭客對數據庫入侵,並盜取想要的資料。數據庫系統的安全特性主要是針對數據而言的,包括數據獨立性、數據安全性、數據完整性、併發控制、故障恢復等幾個方面。我們加強對紙質標準文獻數字化成果的管理,確保其安全、完整和長期可用。

結語

紙質標準文獻的數字化及其管理是一項長期的、複雜的、細緻的、系統性的工作,必須貫徹“統一規劃、分步實施、逐步完善”的工作思路,採取得力措施,紮紮實實地進行,才能取得滿意的成效。