java几十万条xml读取(java从xml中读取数据)

http://www.itjxue.com  2023-02-09 09:24  来源:未知  点击次数: 

Java如何读取XML文件 具体实现

xml的解析

1.解析式为了得到里面的内容,进行增,删,改查的操作

XML的解析方式

SAX(Simple API for XML)xml文档的一种简单的解析方式

DOM(Document Object Model)

DOM4J

SAX:基于事件的解析方式

DOM: 基于对象的解析方式

事件监听三要素

1.事件源

2.监听器

3.事件

SAX 基于事件的解析

优点: 简单 效率高

缺点:顺序执行,不能得到某个元素 不能逆向执行

不能进行增,与删的操作

SAX解析方式工作原理:

通过时间源xml文档创建SAXParseFactory

SAXParserFactory factory=SAXParserFactory.newInstance();

得到一个解析器

SAXParser parse=factory.newSAXParser();

对xml文件进行解析

得到解析的文件对象

File file=new File("employees.xml");

通过监听器进行解析

MyListener listener=new MyListener();

parse.parse(file,listener);

对于监听器有5个方法:监听器所在的类实现的接口有:

org.xml.sax.hepers.DefaultHandler

org.xml.sax

通过查看API文档中的DefaultHandler类中的下面5个方法

startDocument() 对于文档开始的解析

public void startDocument()throws SAXException{

System.out.println("文档开始解析啦!!!!");

}

startElement()元素开始的解析其中几个名词

url:命名空间的url

localName:命名空间的前缀

qName:元素

attributes:元素里的属性

public void startElement(String url,String localName,String qName,Attributes attributes)throws SAXException{

StringBuffer sb=new StringBuffer();

sb.append(""+qName);

for(int i=0;iattributes.getLength();i++){

String attName=attributes.getQName(i);获得元素属性名称其中的i为元素的第几个属性

String attValue=attributes.getValue(i);获得元素属性的值其中的i为元素的第几个属性的值

sb.append(attName+"="+attValue);

}

sb.append("");

System.out.print(sb.toString());

}

character()获得元素的内容体

public void characters(char[]ch,int start,int length)throws SAXException{

System.out.print(new String(ch,start,length));

}

endElement()获得元素的结束事件

public void endElement(String url,String localName,String qName)throws SAXException{

System.out.print("/"+qName+"");

}

endDocument()获得文档的结束事件

public void endDocument(){

System.out.println("文档解析结束啦!!!!");

}

对于SAX解析只能逐行解析不能越行解析

DOM:基于对象的

优点:灵活,能进行增删的操作

缺点:读取速度慢,效率低 占用的内容多

对于DOM解析:不需要添加监听器,按级解析从根元素、一级子元素、二级子元素......

同SAX解析相同刚开始也是要得到一个解析器;

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance() ;

因为构造方法不可用不可以new对象只能用newInstance()方法得到解析器对象

DocumentBuilder builder=factory.newDocumentBuilder() ;得到一个解析器

对于document可以有两种方法得到:

Document document= builder.parse(new File(文件路径));通过parse方法解析一个已有的xml文档

Document document=builder.newDocument();可以得到一个空的document对象

得到根节点

Element root=document.getDocumentElement();

如果不存在根节点即为一个空document对象的时候只能添加跟节点

Element root=document.createElement(根节点的名字)

得到根节点下面的所有一级子元素

NodeList list=root.getElementsByTagName(根节点的名字可以用root.getTagName或者root.getNodeName()得到根节点的名字)();

{

对与document可以添加一级子元素

不管document是否为空都可以添加

Element firstElements =root.creatElement(一级子元素的名字);

当然也可以为一级子元素添加属性

一级子元素的名字.setAttribute("属性名","属性值");

}

通过遍历list集合

for(int i=0;ilist.getLength();i++){

Element first_elements=(Element)list.item(i);

可以得到一级资源的属性的值当知道属性的时候

String attribute=first_elements.getAttribute("属性的名字");

得到一级子元素的名字

String first_elements_name=first_elements.getNodeName();

得到一级子元素下面所有的元素如id 第一个id元素当然也可有很多个id

通过item()来确定要取那个id

Element id_element=(Element)first_elements.getElementByName("id").item(0);

得到id的值

String id_value=id_element.getFirstChild().getTextContent();

通过这个遍历集合可以拿到所有子元素

}

DOM添加或删除元素:

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance() ;

因为构造方法不可用不可以new对象只能用newInstance()方法得到解析器对象

DocumentBuilder builder=factory.newDocumentBuilder() ;得到一个解析器

对于document可以有两种方法得到:

Document document= builder.parse(new File(文件路径));通过parse方法解析一个已有的xml文档

Document document=builder.newDocument();可以得到一个空的document对象

得到根节点

Element root=document.getDocumentElement();

如果不存在根节点即为一个空document对象的时候只能添加跟节点

Element root=document.createElement(根节点的名字)

对与document可以添加一级子元素

不管document是否为空都可以添加

Element firstElements =root.creatElement(一级子元素的名字);

当然也可以为一级子元素添加属性

一级子元素的名字.setAttribute("属性名","属性值");

添加二级子元素

Element secondElements=firstElements.creatElement("二级子元素的名字");

挂载组装

一级子元素firstElements.append(secondElements);

根节点root.appendChild(firstElements);

将document对象树写入磁盘

TransformerFactory tf=TransformerFactory.newInstance();

Transformer former=tf.newTransformer();

DOMSource source=new DOMSource(document);

StreamResult result= new StreamResult(new File("10.xml"));结果集

former.transform(source,result);

完毕

DOM4j需要借助外部jar包

需要借助外部jar包就必须设置环境变量中的classpath把classpath设置成

dom4j jar包存在的路径(绝对路径)

例如:

set classpath=.;C:\Documents and Settings\Administrator\桌面\day3\dom4j.jar

import org.dom4j.io.*;

import java.io.*;

import java.util.*;

import org.dom4j.*;

public static void read_XML(String fileName){

try{

//得到一个解析器,相当于SAX,DOM里面的解析器工厂,与解析器

SAXReader reader=new SAXReader();

//得到一个对象树

Document document=reader.read(new File(fileName));

//得到一个根元素

Element root=document.getRootElement();

System.out.println(root.getName());

//得到所有的一级子元素

List firstElements=root.elements();

Iterator it=firstElements.iterator();

while(it.hasNext()){

//依次得到每一个一级子元素

Element firstElement=(Element)it.next();

System.out.println(firstElement.getName());

//得到所有的属性

List attributes=firstElement.attributes();

for(Object obj:attributes){

//依次得到每一个属性

Attribute att=(Attribute)obj;

System.out.println(att.getName()+"="+att.getValue());

}

//得到一级子元素下面的所有元素,及其附带值

List second_Elements=firstElement.elements();

Iterator second_Element=second_Elements.iterator();

while(second_Element.hasNext()){

Element sec_Element=(Element)second_Element.next();

System.out.println(sec_Element.getName()+":"+sec_Element.getText());

}

System.out.println("----------");

}

}catch(Exception e){

}

}

public static void write(String fileName){

try{

Document document = DocumentHelper.createDocument();

//创造一级子元素

Element books=document.addElement("books");

books.addComment("The book is J2EE");

Element book=books.addElement("book");

创建元素的属性

book.addAttribute("show","yes");

book.addAttribute("page","100");

创建二级子元素

Element book_name=book.addElement("bookName");

创建元素的内容体

book_name.setText("xml");

Element book_price=book.addElement("bookPrice");

book_price.setText("3000");

Element book_press=book.addElement("bookPress");

book_press.setText("etoak");

Element book_author=book.addElement("bookAuthor");

book_author.setText("Robin");

//挂载另一个一级子元素

book=books.addElement("book");

book.addAttribute("show","NO");

book.addAttribute("page","200");

book_name=book.addElement("bookName");

book_name.setText("葵花宝典");

book_price=book.addElement("bookPrice");

book_price.setText("无价之宝");

book_press.addElement("bookPress");

book_press.setText("华山派");

book_author=book.addElement("bookAuthor");

book_author.setText("林平之");

//创建xml文件输出的路径

OutputFormat format=OutputFormat.createPrettyPrint();

format.setEncoding("gbk");

XMLWriter xw=new XMLWriter(new FileOutputStream(fileName),

format);

//XMLWriter xx= new XMLWriter(System.out,OutputFormat.createPrettyPrint());

xw.write(document);

xw.flush();

xw.close();

}catch(Exception e){

对于DOM4j添加子元素,是一级一级的添加的而在DOM中是先创造

子元素然后再挂载的DOM4j在创建子元素的时候就确定好了顺序

对于文件的输出各有千秋各有特色其中SAX是需要添加监听器的

}

}

public static void update(String fileName){

try{

SAXReader reader= new SAXReader();

Document document = reader.read(new File(fileName));

Element root = document.getRootElement();

System.out.println(root.getName());

在根节点上添加一级子元素

Element student=root.addElement("student");

Element id=student.addElement("id");

id.setText("007");

OutputStream os= new FileOutputStream(fileName);

OutputFormat format = OutputFormat.createPrettyPrint();

XMLWriter xw = new XMLWriter(os,format);

xw.write(document);

xw.flush();

xw.close();

}catch(Exception e){

和创建一个新的document对象类似只不过这个的根节点已经存在

直接可以在根节点上添加一级子元素;

}

}

java如何读取xml文件

xml解析还是用dom4j方便,

import?java.util.List;

import?org.dom4j.Document;

import?org.dom4j.DocumentException;

import?org.dom4j.Element;

import?org.dom4j.io.SAXReader;

public?class?XMLPaser?{

public?static?void?main(String[]?args)?{

paserXML();

}

public?static?void?paserXML(){

SAXReader?reader?=?new?SAXReader();

try?{

//?读取XML文件

Document?doc?=?reader.read("NewFile.xml");

Element?root?=?doc.getRootElement();

System.out.println(root.getName());

ListElement?param?=?root.elements();

for?(Element?element?:?param)?{

if(element.attributeValue("name").equals("a")){

System.out.println(element.getText());

}

}

}?catch?(DocumentException?e)?{

e.printStackTrace();

}

}

}

java读取xml文件内容

java中不是有个读取xml文件的类吗?之间调用那类读取出来,然后用取节点的方法去取对应节点的里的值。等下给你代码。

public class ReaderXml {

private static String filename = "E:\\workplace\\readerxml\\bin\\reader\\xml\\reader.xml";

// private static Config config;

public static void main(String []args) throws Exception{

//这里用反射机制

DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance();

DocumentBuilder dombuilder=domfac.newDocumentBuilder();

//读取文件流

InputStream is=new FileInputStream(filename);

Document doc=dombuilder.parse(is);

Element root=doc.getDocumentElement();

//获取所有xml节点

NodeList dbinfo=root.getChildNodes();

if(dbinfo!=null){

for(int i=0;idbinfo.getLength();i++){

//获取节点判断

Node db=dbinfo.item(i);

//如果是Hardwares节点,也就是你xml文件的最顶处的节点

if(db.getNodeName().equals("Hardwares")){

//获取第二个节点包含的所有节点

NodeList list=db.getChildNodes();

for(int y=0;ylist.getLength();y++){

Node n=list.item(y);

//如果节点等于Hardware

if(n.getNodeName().equals("Hardware")){

//获取Hardware节点中的所有节点

NodeList CnodeList=n.getChildNodes();

//取出Hardware里面的所有节点

for(int k=0;kCnodeList.getLength();k++){

//取出节点

Node cn=CnodeList.item(k);

//去掉里面的#text文件节点。没用,这个不是你配置的节点,应该是xml文件隐藏的

if(!cn.getNodeName().equals("#text")){

//打印你所配置的所有节点 System.out.println("node["+k+"]="+cn.getNodeName()+" nodeValue["+k+"]="+cn.getTextContent());

}

}

}

}

}

}

}

}

}

//具体你要干嘛自己弄了!

java 读取 xml

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.NodeList;

//以上是要进行xml文档处理需导入的包和类

public class Xml {

public static void main(String[] args) {

try {

DocumentBuilderFactory factory = DocumentBuilderFactory

.newInstance(); //实例化一个工厂类

DocumentBuilder builder = factory.newDocumentBuilder(); //创建树立xml文档的对象,具体名称我也说不上,其上以上两条语句都是为处理xml文档做准备的,即进行初始化工作

Document document = builder.parse(new File("E:\\xml.xml")); //导入xml文档

Element rootElement = document.getDocumentElement(); //得到根节点对象,即Root

NodeList list = rootElement.getElementsByTagName("Header"); //通过标签名"Header"得到Header结点对象的列表,即所有名为"Header"的结点都被保存在一个list列表对象中

Element element = (Element) list.item(0); //获取第一个list对象,这里就是Header结点

System.out.println(element.getChildNodes().item(0).getNodeValue()); //输出Header结点的第一个子节点的值,这里没有其他子节点,则直接返回"日报表"

} catch (Exception e) {

System.out.println("exception:" + e.getMessage()); //若有异常,则输出异常信息

}

}

}

JAVA 读取XML文件

import java.util.List;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

public class XmlTester {

????public static void main(String[] args) throws DocumentException {

????????// 使用了dom4j解析xml

????????// 读取目录下用来测试的test.xml文件,取得xml主内容

????????Document document = new SAXReader().read("src/abc/test.xml").getDocument();

????????int i = 1;

????????// 遍历文档根节点(wuxialist)下的子节点列表,即txtbook节点的集合

????????for(Element txtbook : (ListElement)document.getRootElement().elements()){

????????????//取得txtbook节点下的name节点的内容

????????????System.out.println(i+"."+txtbook.element("name").getText());

????????????i++; //原来这里少些了这一行,先补上

????????}

????}

}

(责任编辑:IT教学网)

更多

推荐安全产品文章