為有效管理日益增多的電子文件,以協助文件檢索,國際上制定許多標準予 以依循,以便電子文件的流通,包括DocBook、Open Electronic Book(OEB)、Dublin Code 等,以下均予以詳細介紹。
2.1.1 DocBook
DocBook 乃是依照 XML 所規範的一種應用語言,其本身便是一種標準,用 來定義一些技術文件所要用的標記(tag)。DocBook 目前是由 OASIS 的 DocBook Techinical committee 作為維護者,主要是以書本編輯為目的,與 ISO12083 相似;
尤其是應用在軟體文件方面,其包含了許多軟體文件的元件,現已被許多大的電 腦公司所支持。其 DTD 中特別包含了『XML EXCHANGE TABLE MODEL CLARATIONMODULE』,利於表格資料的交換。
以下選擇關於DocBook 標準中具代表性的 tag 其意義與用途稍作介紹:
1. Abstract: 在這個 tag 所包含的 paragraph 是對於之前的文章所做的 summary (有可能是 chapter)。
2. Appendix: 一本書的 appendix。
3. Appendixinfo: 在 4.0 之後才出現的 tag,記錄有關 appendix 的一些資訊(作 者、編輯者、版權、日期、出版商等),在這些 tag 當中,若是結尾有 info 的都有如上的類似特徵,所以在次出現類似的tag 時便不在贅述。
4. Author: 作者。
5. Authorblurb: 對於作者的簡短敘述。
6. Authorgroup: 若是作者有兩人以上則要用此 tag 將作者的 tags 包起來。
7. Beginpage: 對於某個 document 而言,若是要將其 print 出來開始頁是位 於document 的哪處開始。
8. Bibliography: A bibliography。
9. Bibliographyinfo: 類似 appendixinfo。
10. Blockquote: 對於某部分的文章而言,引證某名人的說過的觀點。
11. Book: 定義一本書的 tag。
12. Bookinfo: 類似 appendixinfo。
13. Callout: 對於程式片段或者是些資料的片段,也許是一行,在其後面標 上如 的標記然後在此片段之後再做解釋的tag。
14. Calloutlist: 若是 callout 不只一個,則將一群包在一起(觀念上有一些類 似authorgroup)。
15. Caption: 對於 mediaObject 做解釋(text),例如某圖片是何作者、日期。
16. Caution: 一段警告文字的 note。
17. Chapter: A chapter, as of a book。
18. Chapterinfo: 類似 appendixinfo。
19. Co: 在文字當中直接插入 callout 的標記。
20. Computeroutput: 標示出某段文字是 computer 的 output。
21. Copyright: 對於 document 的版權宣告。
22. Date: 對於這份 document 日期和版本。
23. Dedication: 這本書奉獻給某人。
24. Edition: 這個 document 第幾版。
25. Editor: 編輯者。
26. Equation : 公式。
27. Example: 對於某項 example 的 title。
28. Figure: 圖片,有 title、內容。
29. Footnote: 腳註。
30. Foreignphrase: 相異於 document 基本語言的外來語。
31. Formalpara: 有 title 的 paragraph。
32. Glossary: 術語。
33. Glossaryinfo: 類似 appendixinfo。
34. Highlights: 在 document 中所討論的 main point 的 summary(以一句或是 少許文字來說明)。
35. Important: 將重點特別標示出來。
36. Index: 索引。
37. Isbn: The International Standard Book Number of a document。
38. Issn: The International Standard Serial Number of a periodical。
39. Itemizedlist: 用 bullet or other dingbat 標示出來的 list。
40. Keyword: 描述 document 的 word。
41. Keywordset:包含很多的 keyword。
42. Legalnotice: 一些合法行為的宣告。
43. Link: A hypertext link。
44. Lot: A list of the titles of formal objects (as tables or figures) in a document。
45. Manvolnum: 參考文件的卷或冊數的號碼。
46. Mediaobject: A displayed media object (video, audio, image, etc.) 。 47. Msg: message。
48. Msgset: message set,通常是 error message。
49. Note: 對於主要文章之外所留下來的 message。
50. Objectinfo: 對於 object 的一些資訊。
51. Orderedlist: 有順序(編號或是字母)的 list。
52. Para: A paragraph。
53. Part: 分解 book 的另外一種方法。
54. Partinfo: 類似 appendixinfo。
55. Partintro: 對於一個 part 所做的 introduction。
56. Preface: 對於一本書的某章之前所做的 introduction。
57. Prefaceinfo: 類似 appendixinfo。
58. Primary: 在 index 中要拿做 sort 的部分。
59. Programlisting: 對於程式的部分用 text 的方式 list 出。
60. Pubdate: 發行日。
61. Publisher: 出版商。
62. Reference: 類似在 unix 下的參考文件。
63. Referenceinfo: 類似 appendixinfo。
64. Revision: 描述者校訂的歷史。
65. Screen: 在原始文件中如何呈現則在 browser 時便如何呈現。
66. Section: A recursive section。
67. Sectioninfo: 類似 appendixinfo。
68. Set: 在 docBook 中以 set 為最上層,其下才是許多書(book)。Set 所表示 的是某類書。
69. Setinfo: 類似 appendixinfo。
70. Sgmltag: A component of SGML markup。
71. Subtitle: 副標題。
72. Table: A formal table in a document。
73. Title: 標題(用於 book chapter section 等) 。 74. Trademark: 商標。
75. Ulink: link 的目標是 URL。
76. Warning: 特別警示讀者的一段文字。
2.1.2 Dublin Code
1995 年 3 月 , 國 際 圖 書 館 電 腦 中 心 (OCLC) 與 National Center for Supercomputing Applications (NCSA)共同研討與制定出 Dublin Core(都柏林核心 集)。目的在於希望建立一套描述網路上電子文件特色的方法,以協助資訊之檢 索。因此其將詮釋資料(Metadata)定義為資源述(Resource Description),Dublin Core 所處理之對象將祇限於「類文件物件」(Document-Lick Objects,簡稱 DLO),
DLO 之定義為【可用類似描述傳統印刷文字媒體方式,加以描述的電子檔案】。
其主要目的在幫助使用者查檢網路資源,而不是在詳細描述該資源,因為都 柏林核心集之目標是在發展一個簡單有彈性,且各種專業人員皆可輕易了解與使 用之資料描述格式,所以其只規範了在大部份情況下,必須提及的資料特性。都 柏林核心集其規範了描述網路資源時所最低須具備的15 個項目而這 15 個項目都 是可選擇、可重覆及可延伸的。分別是:
1. Title: 資源名稱。
2. Format: 資源格式,例如:書、錄音帶、.html 檔…。
3. Author: 主要作者。
4. Resource Identifier: 資源識別碼。
5. Other Contributors: 其他作者。
6. Source: 來源。
7. Subject or Keywords: 主題或關鍵詞。
8. Language: 語言。
9. Description: 資源描述。
10. Relation: 關連性。
11. Publisher: 出版者。
12. Coverage: 時空範圍。
13. Date: 日期。
14. Rights Management: 著作權管理。
15. Type: 資源性質,例如:散文、論文…。
2.1.3 Open Electronic Book
Open eBook Publication Structure Specification 1.0 由 Open eBook Authoring Group 於 1998 年冬天到 1999 年夏天制訂。Open eBook Authoring Group 是由 NIST
(the National Institution of Standards and Technology)召集 25 個各種有關出版事 業及出版ebook 的組織所組成。
Open E-book 的 package 採用一個描述檔、多個媒體檔、一個 CSS 的架構,
來制定一本書的格式及架構。
1. 描述檔(or package header):是一個 XML 檔案,裡面利用 Dublin Core 的 規定說明了一本書的基本資料,例如:作者、出版日期、ISBN 等;另外 又利用<manifest>標籤說明 package 中有哪些檔案,這些檔案的類型;利 用<spine>標籤說明 package 中的檔案在 E-book Reader 中呈現的順序。
2. 媒體檔:媒體檔是呈現內容的檔案,將文章的內文放入媒體檔,媒體檔 通常是一個HTML 或是 XHTML 檔案,。
3. CSS:Open E-book 的 package 需要一個 CSS 去裝飾書籍的外觀,字型大 小,顏色等。如果沒有CSS 存在 package 中,Open E-book 將呈現純文 字的畫面。
圖一:Open E-book package 架構圖
以下簡單介紹Open E-book 的 tag:
1. Package: 指出這個 package 有哪些 documents、images、或是其他任何形 式的object。
2. Metadata: 標記這本書的基本資料,又將基本的資料分成兩種
3. Dc-metadata: 儲存 Dublin Core 所規定的規格,例如:contributor、出版 日期、語言、版權。
4. X-metadata: 儲存 Dublin Core 沒有規定的東西,例如:價格、e-mail。
5. Manifest: 條列式的表示出這個 publication 有哪些的元件,元件的類型,
預設的讀取程式及後備讀取程式。
6. Spine: 形容這個 publication 應有的基本架構,閱讀順序。
7. Tour: 給予讀者以不同的方法閱讀。
8. Guide: 提供書裡面各個部分(index、bibliography、reference)的 link,讓 reader 方便提供 link 給讀者。