XML知识点滴(2)
(引用文章,版权归作者,如需删除请联系我)
XML与HTML的比较
n XML将数据与显示分开
<html>
<head>
</head>
<body>
<center>
<h2><font color="red">静夜思</font></h2>
<b>作者:李白</b>
<hr color="blue">
<p><b><i><font size=3 color="green">
窗前明月光,疑是地上霜。<br>
举头望明月,低头思故乡。</font></i></b>
</center>
</body>
</html>
|
<?xml version="1.0" encoding="gb2312"?>
<poem>
<title>静夜思</title>
<author>李白</author>
<content>
<line>窗前明月光</line>
<line>疑是地上霜</line>
<line>举头望明月</line>
<line>低头思故乡</line>
</content>
</poem>
|
n XML对文档的格式要求更加严格
由于HTML文档格式非常松散,导致了HTML文档解析的复杂性,也造成了浏览器兼容的问题,所以XML从一开始,就对文档的格式制定了非常严格的标准,凡是符合这一标准的XML文档就是格式良好的XML文档(Well-Formed XML Documents)。
1) 开始标签必须要有一个结束标签
在HTML文档中,可以直接使用<p>、<tr>、<td>等标签,而不加结束标签,在XML中,开始标签和结束标签必须配套,也就是必须写成<p>…</p>、<tr>…</tr>、<td>…</td>
2) 空元素标签必须被关闭
在HTML文档中,可以使用<br>、<hr>、<img src=”logo.gif” width=”197” height=”81”>等标签,而在XML中,空元素标签必须被关闭。空元素标签用斜杠(/)来关闭,例如:<br/>、<hr/>、<img src=”logo.gif” width=”197” height=”81”/>
3) 所有的标签都区分大小写
在HTML文档中,标签是不区分大小写的,<tr>和</TR>是tr元素的开始标签和结束标签,但是在XML中,<tr>和<TR>是两个不同的标签,开始标签和结束标签的大小写形式必须一致。
4) 所有的标签必须合理嵌套
在HTML文档中,<b><i>…</b></i>是允许的,但是在XML中,这是错误的。在XML中,所有的标签都要成对出现,合理嵌套,正确的形式是:<b><i>…</i></b>。
5) 所有标签的属性值必须用双引号(“”)或单引号(‘’)括起来
在HTML文档中,属性值可以加引号,也可以不加,例如:<hr color=”blue”>和<hr color=blue>都是合法的。在XML文档中,即使是数字字符,也必须加双引号或单引号,例如:<student name=”zhangsan” age=’18’ />。
6) XML有且只能有一个根元素
在HTML中,可以有多个根元素,如下:
<table>…</table>
<table>…</table>
但在XML中,有且只能有一个根元素,如下:
<?xml version=”1.0” encoding=”gb2312”?>
<table>
…
</table>
XML的编辑工具
n Notepad
n UltraEdit
n XMLSpy
XML文档
n 每一个XML文档都有一个逻辑和一个物理结构。
n 物理上而言,文档由称为实体(entities)的存储单元组成,实体都具有内容并且都通过实体的名字进行标识(文档实体和外部DTD子集除外)。实体可以是一段文本、一个文件、一个数据库记录或其他包含数据的项目。一个实体可以引用其他的实体,从而将它们包含在文档中。文档开始于“根(root)”或文档实体(document entitiy)。
n 格式良好的XML文档形成了一种层次树结构,而这个树的书根就是文档实体,与其他实体不同,文档实体没有名字,只有用于表示文档树的根。XML文档的根元素被称为文档元素(document element),它和在其他外部出现的处理指令、注释等作为文档实体的子结点,而根元素本身和其内部的子元素也是一颗树。
n 实体可以包含已分析(parsed)的或未分析的(unparsed)数据。已分析的数据由字符组成,其中一些字符组成字符数据,另一些字符组成标记。已分析的实体(parsed entity)内容被称为它的替换文本,这个文本被看成是文档整体的一部分。在XML处理器分析XML文档时,凡是文档中出现引用已分析实体的地方,都将被该实体的内容所替换。
n 未分析的实体(unparsed entity)是一种资源,它的内容可以是也可以不是文本,并且,如果是文本的话,可以不是XML文本。每一个未分析的实体有一个相关联的用名字标识的记号(notation)。除了要求XML处理器能向应用程序提供可用的实体和记号的标识之外,XML对未分析的实体内容不作任何限制。
n 已分析的实体以实体引用的方式通过名称来调用;未分析的实体通过ENTITY或ENTITIES属性中给出的名字来调用。
n 逻辑上而言,文档由声明、元素、注释、字符引用和处理指令组成,在文档中,所有这些都是通过显式的标记(markup)来指明的。
n XML标记(markup)包括开始标签(tag)、结束标签、空元素标签、实体引用、字符引用、注释、CDATA段定界符、文档类型声明、处理指令、XML声明、文本声明以及任何在文档实体顶层的空白(即,在文档元素之外,且不在任何其他的标记内部)。其他所有非标记的文本组成文档的字符数据。
n XML文档在逻辑上主要由以下五个部分组成
1) XML声明
2) 文档类型声明
3) 元素
4) 注释
5) 处理指令
分享到:
相关推荐
XML知识技能培训XML知识技能培训XML知识技能培训
使用java工具xml2axml.jar反编译AndroidManafest文件 通过xml2axml.jar工具反编译AndroidManafest文件 还原AndroidManafest.xml详细过程: 1、获取到apk 2、解压获取里面的AndroidManifest.xml文件 3、在xml2axml....
XML基础知识大全..XML基础知识大全
这是xml啊。
XML基础知识 一、 XML: a) XML是Extensible Markup Language的缩写,即可扩展标记语言,是一种简单的数据存储语言,使用一系列简单的标记来描述数据。 二、 XML的特点: a) XML与操作系统、编程语言的开发平台都...
tinyxml与tinyxml2两个版本的源码,操作xml很方便,解压可以直接使用.
XMLBOOK xml基础知识!为网页类型!下载后无需安装,有IE就可以浏览学习。
xml学习知识
DOM初步 DOM是Document Object Model的缩写,即文档对象模型。...通俗的说,就是通过解析XML文档,为XML文档在逻辑上建立一个树模型,树的节点是一个个对象。我们通过存取这些对象就能够存取XML文档的内容。
使用java工具反编译AndroidManafest文件 本文介绍通过xml2axml.jar工具反编译AndroidManafest文件
在研究和分析了四种XML存储方式各自特点的基础上,针对Native-XML数据库,提出了基于模式语义块的XML页-记录存储方法。
xml教程,详尽的介绍了xml的发展,语法,字符集,及连接数据库,应用前景等等知识
xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作xml操作
xml基本知识,两种常见的xml约束,三种常见的xml解析方式
XML技术基础知识的介绍,适合初学者学习。
XML初步知识讲义,适合于XML知识的初学者。
xml基础,xml语言的定义,xml的数据岛,xml结点的设置、获取。
XML相关基础知识集合XML相关基础知识集合XML相关基础知识集合XML相关基础知识集合
TinyXML2是simple、small、efficient开源的C++ XML文件解析库,可以很方便的应用到现有的项目之中。非常适合存储简单数据,配置文件,对象序列化等数据量不是很大的操作。