3.7 Java與XML聯(lián)合編程之SAX篇
SAX概念
SAX是Simple API for XML的縮寫,它并不是由W3C官方所提出的標(biāo)準(zhǔn),可以說是“民間”的事實(shí)標(biāo)準(zhǔn)。實(shí)際上,它是一種社區(qū)性質(zhì)的討論產(chǎn)物。雖然如此,在XML中對(duì)SAX的應(yīng)用絲毫不比DOM少,幾乎所有的XML解析器都會(huì)支持它。
與DOM比較而言,SAX是一種輕量型的方法。我們知道,在處理DOM的時(shí)候,我們需要讀入整個(gè)的XML文檔,然后在內(nèi)存中創(chuàng)建DOM樹,生成DOM樹上的每個(gè)Node對(duì)象。當(dāng)文檔比較小的時(shí)候,這不會(huì)造成什么問題,但是一旦文檔大起來,處理DOM就會(huì)變得相當(dāng)費(fèi)時(shí)費(fèi)力。特別是其對(duì)于內(nèi)存的需求,也將是成倍的增長,以至于在某些應(yīng)用中使用DOM是一件很不劃算的事(比如在applet中)。這時(shí)候,一個(gè)較好的替代解決方法就是SAX。
SAX在概念上與DOM完全不同。首先,不同于DOM的文檔驅(qū)動(dòng),它是事件驅(qū)動(dòng)的,也就是說,它并不需要讀入整個(gè)文檔,而文檔的讀入過程也就是SAX的解析過程。所謂事件驅(qū)動(dòng),是指一種基于回調(diào)(callback)機(jī)制的程序運(yùn)行方法。(如果你對(duì)Java新的代理事件模型比較清楚的話,就會(huì)很容易理解這種機(jī)制了)
在XMLReader接受XML文檔,在讀入XML文檔的過程中就進(jìn)行解析,也就是說讀入文檔的過程和解析的過程是同時(shí)進(jìn)行的,這和DOM區(qū)別很大。解析開始之前,需要向XMLReader注冊(cè)一個(gè)ContentHandler,也就是相當(dāng)于一個(gè)事件監(jiān)聽器,在ContentHandler中定義了很多方法,比如startDocument(),它定制了當(dāng)在解析過程中,遇到文檔開始時(shí)應(yīng)該處理的事情。當(dāng)XMLReader讀到合適的內(nèi)容,就會(huì)拋出相應(yīng)的事件,并把這個(gè)事件的處理權(quán)代理給ContentHandler,調(diào)用其相應(yīng)的方法進(jìn)行響應(yīng)。
這樣泛泛的說來或許有些不容易理解,別急,后面的例子會(huì)讓你明白SAX的解析過程?纯催@個(gè)簡單XML文件:
Ogden Nash
Adam
當(dāng)XMLReader讀到標(biāo)簽時(shí),就會(huì)調(diào)用ContentHandler.startElement()方法,并把標(biāo)簽名POEM作為參數(shù)傳遞過去。在你實(shí)現(xiàn)的startElement()方法中需要做相應(yīng)的動(dòng)作,以處理當(dāng)出現(xiàn)時(shí)應(yīng)該做的事情。各個(gè)事件隨著解析的過程(也就是文檔讀入的過程)一個(gè)個(gè)順序的被拋出,相應(yīng)的方法也會(huì)被順序的調(diào)用,最后,當(dāng)解析完成,方法都被調(diào)用后,對(duì)文檔的處理也就完成了。下面的這個(gè)表,列出了在解析上面的那個(gè)XML文件的時(shí)候,順序被調(diào)用的方法:
遇到的項(xiàng)目 方法回調(diào)
{文檔開始} startDocument()
startElement(null,"POEM",null,{Attributes})
"\n" characters("\n...", 6, 1)
startElement(null,"AUTHOR",null,{Attributes})
"Ogden Nash" characters("\n...", 15, 10)
endElement(null,"AUTHOR",null)
"\n" characters("\n...", 34, 1)
endElement(null,"TITLE",null)
"\n" characters("\n...", 55, 1)
startElement(null,"LINE",null,{Attributes})
"Adam" characters("\n...", 62, 4)
endElement(null,"LINE",null)
"\n" characters("\n...", 67, 1)
endElement(null,"POEM",null)
{文檔結(jié)束} endDocument()
相關(guān)推薦:計(jì)算機(jī)等級(jí)考試二級(jí)Java經(jīng)典算法大全匯總
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |