可扩展标记语言(Extensive Markup Language),标签中的元素名是可以自己随意写,可拓展是相对于html来说
标记语言:由一对尖括号括起来<内容>,就称为标记,标签;代码都是由标签组成,就称为标记语言
.xml
version 是版本的意思, encoding 是编码集
<?xml version='1.0' encoding='utf-8'?>
<!-- 注释 -->
1、xml文件中有且只有一个根标签
2、标签中可以定义属性,在给属性赋值的时候,值要用引号括起来(单双都可)
3、标签名区分大小写
4、标签的闭合
<aaa></aaa>
有头有尾<bbb/>
自闭和5、标签名的命名规则
<aa a></aa a>
<xml></xml>
文档类型定义
<!DOCTYPE books[
<!ELEMENT books (book+)>
<!ELEMENT book (name,price)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT price (#PCDATA)>
]>
<books>
<book>
<name>三国</name>
<price>386</price>
</book>
<book>
<name>水浒</name>
<price>400</price>
</book>
</books>
dtd文件:books.dtd
<!ELEMENT books (book+)>
<!ELEMENT book (name,price)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT price (#PCDATA)>
引入
<!DOCTYPE books SYSTEM "books.dtd">
<!DOCTYPE books PUBLIC "DTD名称" "DTD文档的URL">
就是指先将xml文件一次性的加载进内存中,在内存中形成一个树状结构(dom树)
优点:我们可以通过dom方式的解析,对xml文件中的数据进行增删改查
缺点:如果树太大了,非常占内存空间
Simple APIs for XML(简单应用程序接口)
基于事件处理的,逐行扫描,逐行加载。
优点:逐行扫描,读取一行,加载一行,加载完就扔了,不占用内存空间
缺点:执行过程不可逆,不能对数据进行增删改操作,只能进行查询操作,不能回头了
<dependency>
<groupId>org.dom4j</groupId>
<artifactId>dom4j</artifactId>
<version>2.0.0</version>
</dependency>
public static void main(String[] args) throws DocumentException {
SAXReader saxReader = new SAXReader();
//解析XML文件、获取树对象
Document doc = saxReader.read(new File("java20210519/src/study/books.xml"));
//如果是xml格式字符串,使用DocumentHelper.parseText()进行解析
//Document doc = DocumentHelper.parseText(xmlStr);
//获取根标签对象
Element root = doc.getRootElement();
//获取根元素下的子元素对象集合
List<Element> list = root.elements();
for (Element element : list){
//获取该元素下的子元素name
Element name = element.element("name");
//获取该元素下的子元素price
Element price = element.element("price");
//获取name、price元素的文本信息
System.out.println("名称:" + name.getText() + ",价格:" + price.getText());
}
}
Element对象
// 获取所有的子标签
List<Element> elements();
// 获取元素的名字
String getName();
// 获取标签内的文本内容
String getText();
// 根据标签名获取指定第一个标签对象
Element element(String name);
// 根据属性名获取属性值
String attributeValue(String name);
// 返回xml字符串
String asXML();