当前位置： > 网络安全 > 安全产品 > 文章内容

java几十万条xml读取(java从xml中读取数据)

http://www.itjxue.com 2023-02-09 09:24 来源:未知 点击次数:

Java如何读取XML文件具体实现

xml的解析

1.解析式为了得到里面的内容，进行增,删，改查的操作

XML的解析方式

SAX(Simple API for XML)xml文档的一种简单的解析方式

DOM(Document Object Model)

DOM4J

SAX：基于事件的解析方式

DOM: 基于对象的解析方式

事件监听三要素

1.事件源

2.监听器

3.事件

SAX 基于事件的解析

优点: 简单效率高

缺点:顺序执行,不能得到某个元素不能逆向执行

不能进行增，与删的操作

SAX解析方式工作原理：

通过时间源xml文档创建SAXParseFactory

SAXParserFactory factory=SAXParserFactory.newInstance();

得到一个解析器

SAXParser parse=factory.newSAXParser();

对xml文件进行解析

得到解析的文件对象

File file=new File("employees.xml");

通过监听器进行解析

MyListener listener=new MyListener();

parse.parse(file,listener);

对于监听器有5个方法：监听器所在的类实现的接口有：

org.xml.sax.hepers.DefaultHandler

org.xml.sax

通过查看API文档中的DefaultHandler类中的下面5个方法

startDocument() 对于文档开始的解析

public void startDocument()throws SAXException{

System.out.println("文档开始解析啦!!!!");

}

startElement()元素开始的解析其中几个名词

url:命名空间的url

localName:命名空间的前缀

qName:元素

attributes:元素里的属性

public void startElement(String url,String localName,String qName,Attributes attributes)throws SAXException{

StringBuffer sb=new StringBuffer();

sb.append(""+qName);

for(int i=0;iattributes.getLength();i++){

String attName=attributes.getQName(i);获得元素属性名称其中的i为元素的第几个属性

String attValue=attributes.getValue(i);获得元素属性的值其中的i为元素的第几个属性的值

sb.append(attName+"="+attValue);

}

sb.append("");

System.out.print(sb.toString());

}

character()获得元素的内容体

public void characters(char[]ch,int start,int length)throws SAXException{

System.out.print(new String(ch,start,length));

}

endElement()获得元素的结束事件

public void endElement(String url,String localName,String qName)throws SAXException{

System.out.print("/"+qName+"");

}

endDocument()获得文档的结束事件

public void endDocument(){

System.out.println("文档解析结束啦!!!!");

}

对于SAX解析只能逐行解析不能越行解析

DOM:基于对象的

优点:灵活,能进行增删的操作

缺点:读取速度慢，效率低占用的内容多

对于DOM解析：不需要添加监听器，按级解析从根元素、一级子元素、二级子元素......

同SAX解析相同刚开始也是要得到一个解析器;

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance() ;

因为构造方法不可用不可以new对象只能用newInstance()方法得到解析器对象

DocumentBuilder builder=factory.newDocumentBuilder() ;得到一个解析器

对于document可以有两种方法得到：

Document document= builder.parse(new File(文件路径));通过parse方法解析一个已有的xml文档

Document document=builder.newDocument();可以得到一个空的document对象

得到根节点

Element root=document.getDocumentElement();

如果不存在根节点即为一个空document对象的时候只能添加跟节点

Element root=document.createElement(根节点的名字)

得到根节点下面的所有一级子元素

NodeList list=root.getElementsByTagName(根节点的名字可以用root.getTagName或者root.getNodeName()得到根节点的名字)();

{

对与document可以添加一级子元素

不管document是否为空都可以添加

Element firstElements =root.creatElement(一级子元素的名字);

当然也可以为一级子元素添加属性

一级子元素的名字.setAttribute("属性名","属性值");

}

通过遍历list集合

for(int i=0;ilist.getLength();i++){

Element first_elements=(Element)list.item(i);

可以得到一级资源的属性的值当知道属性的时候

String attribute=first_elements.getAttribute("属性的名字");

得到一级子元素的名字

String first_elements_name=first_elements.getNodeName();

得到一级子元素下面所有的元素如id 第一个id元素当然也可有很多个id

通过item()来确定要取那个id

Element id_element=(Element)first_elements.getElementByName("id").item(0);

得到id的值

String id_value=id_element.getFirstChild().getTextContent();

通过这个遍历集合可以拿到所有子元素

}

DOM添加或删除元素：

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance() ;

因为构造方法不可用不可以new对象只能用newInstance()方法得到解析器对象

DocumentBuilder builder=factory.newDocumentBuilder() ;得到一个解析器

对于document可以有两种方法得到：

Document document= builder.parse(new File(文件路径));通过parse方法解析一个已有的xml文档

Document document=builder.newDocument();可以得到一个空的document对象

得到根节点

Element root=document.getDocumentElement();

如果不存在根节点即为一个空document对象的时候只能添加跟节点

Element root=document.createElement(根节点的名字)

对与document可以添加一级子元素

不管document是否为空都可以添加

Element firstElements =root.creatElement(一级子元素的名字);

当然也可以为一级子元素添加属性

一级子元素的名字.setAttribute("属性名","属性值");

添加二级子元素

Element secondElements=firstElements.creatElement("二级子元素的名字");

挂载组装

一级子元素firstElements.append(secondElements);

根节点root.appendChild(firstElements);

将document对象树写入磁盘

TransformerFactory tf=TransformerFactory.newInstance();

Transformer former=tf.newTransformer();

DOMSource source=new DOMSource(document);

StreamResult result= new StreamResult(new File("10.xml"));结果集

former.transform(source,result);

完毕

DOM4j需要借助外部jar包

需要借助外部jar包就必须设置环境变量中的classpath把classpath设置成

dom4j jar包存在的路径（绝对路径）

例如:

set classpath=.;C:\Documents and Settings\Administrator\桌面\day3\dom4j.jar

import org.dom4j.io.*;

import java.io.*;

import java.util.*;

import org.dom4j.*;

public static void read_XML(String fileName){

try{

//得到一个解析器，相当于SAX,DOM里面的解析器工厂，与解析器

SAXReader reader=new SAXReader();

//得到一个对象树

Document document=reader.read(new File(fileName));

//得到一个根元素

Element root=document.getRootElement();

System.out.println(root.getName());

//得到所有的一级子元素

List firstElements=root.elements();

Iterator it=firstElements.iterator();

while(it.hasNext()){

//依次得到每一个一级子元素

Element firstElement=(Element)it.next();

System.out.println(firstElement.getName());

//得到所有的属性

List attributes=firstElement.attributes();

for(Object obj:attributes){

//依次得到每一个属性

Attribute att=(Attribute)obj;

System.out.println(att.getName()+"="+att.getValue());

}

//得到一级子元素下面的所有元素，及其附带值

List second_Elements=firstElement.elements();

Iterator second_Element=second_Elements.iterator();

while(second_Element.hasNext()){

Element sec_Element=(Element)second_Element.next();

System.out.println(sec_Element.getName()+":"+sec_Element.getText());

}

System.out.println("----------");

}

}catch(Exception e){

}

public static void write(String fileName){

try{

Document document = DocumentHelper.createDocument();

//创造一级子元素

Element books=document.addElement("books");

books.addComment("The book is J2EE");

Element book=books.addElement("book");

创建元素的属性

book.addAttribute("show","yes");

book.addAttribute("page","100");

创建二级子元素

Element book_name=book.addElement("bookName");

创建元素的内容体

book_name.setText("xml");

Element book_price=book.addElement("bookPrice");

book_price.setText("3000");

Element book_press=book.addElement("bookPress");

book_press.setText("etoak");

Element book_author=book.addElement("bookAuthor");

book_author.setText("Robin");

//挂载另一个一级子元素

book=books.addElement("book");

book.addAttribute("show","NO");

book.addAttribute("page","200");

book_name=book.addElement("bookName");

book_name.setText("葵花宝典");

book_price=book.addElement("bookPrice");

book_price.setText("无价之宝");

book_press.addElement("bookPress");

book_press.setText("华山派");

book_author=book.addElement("bookAuthor");

book_author.setText("林平之");

//创建xml文件输出的路径

OutputFormat format=OutputFormat.createPrettyPrint();

format.setEncoding("gbk");

XMLWriter xw=new XMLWriter(new FileOutputStream(fileName),

format);

//XMLWriter xx= new XMLWriter(System.out,OutputFormat.createPrettyPrint());

xw.write(document);

xw.flush();

xw.close();

}catch(Exception e){

对于DOM4j添加子元素，是一级一级的添加的而在DOM中是先创造

子元素然后再挂载的DOM4j在创建子元素的时候就确定好了顺序

对于文件的输出各有千秋各有特色其中SAX是需要添加监听器的

}

public static void update(String fileName){

try{

SAXReader reader= new SAXReader();

Document document = reader.read(new File(fileName));

Element root = document.getRootElement();

System.out.println(root.getName());

在根节点上添加一级子元素

Element student=root.addElement("student");

Element id=student.addElement("id");

id.setText("007");

OutputStream os= new FileOutputStream(fileName);

OutputFormat format = OutputFormat.createPrettyPrint();

XMLWriter xw = new XMLWriter(os,format);

xw.write(document);

xw.flush();

xw.close();

}catch(Exception e){

和创建一个新的document对象类似只不过这个的根节点已经存在

直接可以在根节点上添加一级子元素；

}

java如何读取xml文件

xml解析还是用dom4j方便，

import?java.util.List;

import?org.dom4j.Document;

import?org.dom4j.DocumentException;

import?org.dom4j.Element;

import?org.dom4j.io.SAXReader;

public?class?XMLPaser?{

public?static?void?main(String[]?args)?{

paserXML();

}

public?static?void?paserXML(){

SAXReader?reader?=?new?SAXReader();

try?{

//?读取XML文件

Document?doc?=?reader.read("NewFile.xml");

Element?root?=?doc.getRootElement();

System.out.println(root.getName());

ListElement?param?=?root.elements();

for?(Element?element?:?param)?{

if(element.attributeValue("name").equals("a")){

System.out.println(element.getText());

}

}?catch?(DocumentException?e)?{

e.printStackTrace();

}

java读取xml文件内容

java中不是有个读取xml文件的类吗？之间调用那类读取出来，然后用取节点的方法去取对应节点的里的值。等下给你代码。

public class ReaderXml {

private static String filename = "E:\\workplace\\readerxml\\bin\\reader\\xml\\reader.xml";

// private static Config config;

public static void main(String []args) throws Exception{

//这里用反射机制

DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance();

DocumentBuilder dombuilder=domfac.newDocumentBuilder();

//读取文件流

InputStream is=new FileInputStream(filename);

Document doc=dombuilder.parse(is);

Element root=doc.getDocumentElement();

//获取所有xml节点

NodeList dbinfo=root.getChildNodes();

if(dbinfo!=null){

for(int i=0;idbinfo.getLength();i++){

//获取节点判断

Node db=dbinfo.item(i);

//如果是Hardwares节点，也就是你xml文件的最顶处的节点

if(db.getNodeName().equals("Hardwares")){

//获取第二个节点包含的所有节点

NodeList list=db.getChildNodes();

for(int y=0;ylist.getLength();y++){

Node n=list.item(y);

//如果节点等于Hardware

if(n.getNodeName().equals("Hardware")){

//获取Hardware节点中的所有节点

NodeList CnodeList=n.getChildNodes();

//取出Hardware里面的所有节点

for(int k=0;kCnodeList.getLength();k++){

//取出节点

Node cn=CnodeList.item(k);

//去掉里面的#text文件节点。没用，这个不是你配置的节点，应该是xml文件隐藏的

if(!cn.getNodeName().equals("#text")){

//打印你所配置的所有节点 System.out.println("node["+k+"]="+cn.getNodeName()+" nodeValue["+k+"]="+cn.getTextContent());

}

//具体你要干嘛自己弄了！

java几十万条xml读取(java从xml中读取数据)

java 读取 xml

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.NodeList;

//以上是要进行xml文档处理需导入的包和类

public class Xml {

public static void main(String[] args) {

try {

DocumentBuilderFactory factory = DocumentBuilderFactory

.newInstance(); //实例化一个工厂类

DocumentBuilder builder = factory.newDocumentBuilder(); //创建树立xml文档的对象，具体名称我也说不上，其上以上两条语句都是为处理xml文档做准备的，即进行初始化工作

Document document = builder.parse(new File("E:\\xml.xml")); //导入xml文档

Element rootElement = document.getDocumentElement(); //得到根节点对象,即Root

NodeList list = rootElement.getElementsByTagName("Header"); //通过标签名"Header"得到Header结点对象的列表，即所有名为"Header"的结点都被保存在一个list列表对象中

Element element = (Element) list.item(0); //获取第一个list对象，这里就是Header结点

System.out.println(element.getChildNodes().item(0).getNodeValue()); //输出Header结点的第一个子节点的值，这里没有其他子节点，则直接返回"日报表"

} catch (Exception e) {

System.out.println("exception:" + e.getMessage()); //若有异常，则输出异常信息

}

JAVA 读取XML文件

import java.util.List;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

public class XmlTester {

????public static void main(String[] args) throws DocumentException {

????????// 使用了dom4j解析xml

????????// 读取目录下用来测试的test.xml文件，取得xml主内容

????????Document document = new SAXReader().read("src/abc/test.xml").getDocument();

????????int i = 1;

????????// 遍历文档根节点（wuxialist）下的子节点列表，即txtbook节点的集合

????????for(Element txtbook : (ListElement)document.getRootElement().elements()){

????????????//取得txtbook节点下的name节点的内容

????????????System.out.println(i+"."+txtbook.element("name").getText());

????????????i++; //原来这里少些了这一行，先补上

????????}

????}

}

(责任编辑：IT教学网)

复制链接发给好友收藏本文关闭此页

上一篇：如何启动服务器服务(服务器启动服务命令)

下一篇：手机u盘修复大师安卓版(手机u盘修复大师安卓版怎么用)

java几十万条xml读取(java从xml中读取数据)

Java如何读取XML文件具体实现

java如何读取xml文件

java读取xml文件内容

java 读取 xml

JAVA 读取XML文件

(责任编辑：IT教学网)

相关安全产品文章

阅读排行

专题教程

推荐安全产品文章

最新更新安全产品

java几十万条xml读取(java从xml中读取数据)

Java如何读取XML文件 具体实现

java如何读取xml文件

java读取xml文件内容

java 读取 xml

JAVA 读取XML文件

(责任编辑：IT教学网)

相关安全产品文章

阅读排行

专题教程

推荐安全产品文章

最新更新安全产品

Java如何读取XML文件具体实现