dom规范和在Java中的实现(一) (二)(三) sunmingdong 概念: 1、DOM就是一个对象化的XML数据接口;
2、一个与语言无关、与平台无关的标准接口规范;
3、它定义了Html文档和XML文档的逻辑结构;
4、给出了一种访问和处理HTML文档和XML文档的方法(动态地创建文档,遍历文档结构,添加、修改、删除文档内容,改变文档的显示方式等等)。
组成: ü DOM由三部分组成,包括:核心(core)、HTML和XML。
ü 核心部分是结构化文档比较底层对象的集合;
ü HTML接口和XML接口两部分则是专为操作具体的HTML文档和XML文档所提供的高级接口,使对这两类文件的操作更加方便。
版本: ü 1998年8月18日通过的DOM Level 1;
ü 2000年3月7日 DOM Level 2;
ü DOM Level 3。
XML基本概念 XML 声明:<?xml version="1.0" encoding="UTF-8"?>
DOCTYPE 声明:<!DOCTYPE ORDERS SYSTEM "orders.dtd">
数据本身:<orders><order><customerid limit="1000">12341</customerid></order> </orders> 元素:
属性:
文本:
文档:
CData:<[CDATA[<b>Important: Please keep head and hands inside ride at <i>all times</i>.</b>]]>
注释:<!--This is a comment. -->
处理指令:<?xml-stylesheet type="text/xsl" href="foo.xsl"?>
文档片段:<item instock="Y" itemid="SA15">
<name>Silver Show Saddle, 16 inch</name>
<price>825.00</price>
<qty>1</qty>
</item>
<item instock="N" itemid="C49">
<name>Premium Cinch</name>
<price>49.00</price>
<qty>1</qty>
</item>
实体:
实体引用节点:
记号:
名字空间: 基本接口接口定义(java API package:org.w3c.dom):
类继续图(箭头指向的是父类,另一端为子类)
1.Node接口
Node接口在整个DOM树中具有举足轻重的地位,DOM接口中有很大一部分接口是从Node接口继续过来的,例如,Element、Attr、CDATASection等接口,都是从Node继续过来的。在DOM树中,Node接口代表了树中的一个节点。
Field Summary static short ATTRIBUTE_NODE The node is an Attr. static short CDATA_SECTION_NODE The node is a CDATASection. static short COMMENT_NODE The node is a Comment. static short DOCUMENT_FRAGMENT_NODE The node is a DocumentFragment. static short DOCUMENT_NODE The node is a Document. static short DOCUMENT_TYPE_NODE The node is a DocumentType. static short ELEMENT_NODE The node is an Element. static short ENTITY_NODE The node is an Entity. static short ENTITY_REFERENCE_NODE The node is an EntityReference. static short NOTATION_NODE The node is a Notation. static short PROCESSING_INSTRUCTION_NODE The node is a ProcessingInstruction. static short TEXT_NODE The node is a Text node.
Method Summary Node appendChild(Node newChild) 将节点对象添加到本节点的子节点列表的末尾 Node cloneNode(boolean deep) 创建新的节点对象,他是本节点的克隆,假如deep=true,他将包含本节点的所有子孙节点。 NamedNodeMap getAttributes() 假如是节点,返回一个包含所有属性的NamedNodeMap对象,否则为空。 NodeList getChildNodes() 返回包含所有子节点的NodeList对象 Node getFirstChild() 得到第一个子节点 Node getLastChild() 得到最后一个子节点 java.lang.String getLocalName() 返回本节点合法名字的本地部分 java.lang.String getNamespaceURI() 返回本节点命名空间的URI,未指明的话返回null Node getNextSibling() 得到本节点的下一个兄弟节点 java.lang.String getNodeName() 得到本节点的名字 short getNodeType() 得到一个节点类型 java.lang.String getNodeValue() 得到一个节点值 Document getOwnerDocument() 返回本节点所属的Document对象 Node getParentNode() 得到父节点 java.lang.String getPrefix() 返回本节点的命名空间前缀,假如未指定返回null Node getPreviousSibling() 得到本节点的上一个兄弟节点 boolean hasAttributes() 返回是否有属性 boolean hasChildNodes() 返回本节点是否有任何子节点 Node insertBefore(Node newChild, Node refChild) 在参考节点refChild前插入新节点newChild boolean isSupported(java.lang.String feature, java.lang.String version) 测试version版本的DOM规范是否支持feature特性 void normalize() Puts all Text nodes in the full depth of the sub-tree underneath this Node, including attribute nodes, into a "normal" form where only structure (e.g., elements, comments, processing instructions, CDATA sections, and entity references) separates Text nodes, i.e., there are neither adjacent Text nodes nor empty Text nodes. Node removeChild(Node oldChild) 从子节点列中删除节点 Node replaceChild(Node newChild, Node oldChild) 替换oldChild节点为newChild void setNodeValue(java.lang.String nodeValue) void setPrefix(java.lang.String prefix) 2.NodeList接口
NodeList接口提供了对节点集合的抽象定义,它并不包含如何实现这个节点集的定义。NodeList用于表示有顺序关系的一组节点,比如某个节点的子节点序列。另外,它还出现在一些方法的返回值中,例如GetNodeByName。
在DOM中,NodeList的对象是"live"的,换句话说,对文档的改变,会直接反映到相关的NodeList对象中。例如,假如通过DOM获得一个NodeList对象,该对象中包含了某个Element节点的所有子节点的集合,那么,当再通过DOM对Element节点进行操作(添加、删除、改动节点中的子节点)时,这些改变将会自动地反映到NodeList对象中,而不需DOM应用程序再做其他额外的操作。
NodeList中的每个item都可以通过一个索引来访问,该索引值从0开始。
Method Summary int getLength() 列表中节点长度 Node item(int index) 返回第index个节点
3.NamedNodeMap接口
实现了NamedNodeMap接口的对象中包含了可以通过名字来访问的一组节点的集合。不过注重,NamedNodeMap并不是从NodeList继续过来的,它所包含的节点集中的节点是无序的。尽管这些节点也可以通过索引来进行访问,但这只是提供了枚举NamedNodeMap中所包含节点的一种简单方法,并不表明在DOM规范中为NamedNodeMap中的节点规定了一种排列顺序。
NamedNodeMap表示的是一组节点和其唯一名字的一一对应关系,这个接口主要用在属性节点的表示上。 与NodeList相同,在DOM中,NamedNodeMap对象也是"live"的。
Method Summary int getLength() 得到映射中的节点个数 Node getNamedItem(java.lang.String name) 通过唯一名字得到一个节点 Node getNamedItemNS(java.lang.String namespaceURI, java.lang.String localName) 通过本地名和命名空间的URI得到唯一的节点 Node item(int index) 得到在影射中的第index个节点 Node removeNamedItem(java.lang.String name) 通过唯一名字删除一个节点 Node removeNamedItemNS(java.lang.String namespaceURI, java.lang.String localName) 通过本地名和命名空间删除唯一的节点 Node setNamedItem(Node arg) 用arg增加一个节点 Node setNamedItemNS(Node arg) 用命名空间的URI和当地名增加一个节点
高级接口: Interface Summary Attr 代表元素对象的属性 CDATASection DTD或模式中的CDATA项用于将不希望被解释为标记的文本块“转义”。在DTD中,使用<!CDATA…>声明 CharacterData 在DOM中,提供一套方法和属性操作字符数据 Comment 代表注释元素的内容 Document Document接口描述了整个HTML或XML文档 DocumentFragment DocumentFragment是一个轻量对象,他可以创建新的文档片断,然后将整个片断插入到一有的文档中 DocumentType 包含文档的类型声明或模式信息 DOMImplementation 该对象答应访问与应用程序相关且独立于任何特定的文档对象模型实例的方法 Element 代表HTML/XML文档中的元素,常见元素有:Element、Attr、Text Entity 代表在DTD中以元素<!ENTITY…>声明的解析的或未解析的实体 EntityReference 代表XML文档中的实体引用节点,假如XML处理器在构建结构模型时展开了实体引用,树中可能不会出现实体引用对象。 Notation 代表在DTD或模式中以元素<!NOTATION…>声明表示法 ProcessingInstruction 代表通过’<?’和’?>’嵌入XML的指令,它提供了在XML文档中保存与处理器相关的信息的方法 Text 代表元素节点或属性节点的文本内容
重要的节点类型 从NODE派生出的几个比较重要的节点类型有Document Element, Attribute,Text:
Document是DOM树的根,它代表一个完整的XML文档。它会有一些自己的子节点,至少应该有一个文档元素的子节点,这个节点类型为Element,是XML文件最外层的根元素,此外他还可能有DocumentType(唯一),ProcessingInstruction,Comment这几种作为子节点。
Element代表XML元素,是最常用的节点,它可以组成以它为根的DOM的子树。他还可以有Element子节点,以及Attribut,Text,ProcessingInstruction,CDATASection,Comment子节点。
Attribute是XML元素的属性,它的父节点必然是Element,它的子节点有Text和EntityReference;
Text代表元素节点或属性节点的文本内容。
|