C++读入XML文件示例

最近要做一个VRP的算法,测试集都是放在Xml文件中,而我的算法使用C++来写,所以需要用C++来读取Xml文件。

在百度上搜“C++读取Xml文件”,可以出来很多博客,大多数是关于tinyXml的,所以这篇博文也是讲述如何用tinyXML来读取XML文件。

tinyXml是一个免费开源的C++库,可以到官网上下载:https://sourceforge.net/projects/tinyxml/

下载下来解压之后,可以看到下面这些文件:

我是在windows下用VS来写C++的,按照@marchtea的说法,只需要直接打开tinyxml.sln就可以,不过我还是用了笨办法:

  • 把tinystr.cpp, tinyxml.cpp, tinyxmlerror.cpp, tinyxmlparser.cpp, tinystr.h, tinyxml.h拷贝到工程目录下;
  • 然后加入头文件引用:#include "tinystr.h"   #include "tinyxml.h"。

接下来就来分享一下我读取VRP问题中的solomon benchmark的方法,这些方法都是参考自tinyXml的官方教程,在下载的文件夹中有"doc"子文件夹,打开它,有一个叫做"tutorial0"的html文件,打开它可以看到详细的教程。

OK,now begins!

我要读取的Xml文件有如下的格式(只列举部分):

<!-- 要读取的Xml文件 -->

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>

<instance>

  <network>

    <nodes>

      <node id="0" type="0">

        <cx>40.0</cx>

        <cy>50.0</cy>

      </node>

    <!-- 有N+1个这样的node节点 -->

    </nodes>  

  </network>

  <requests>

    <request id="1" node="1">

      <tw>

        <start>145</start>

        <end>175</end>

      </tw>

      <quantity>20.0</quantity>

      <service_time>10.0</service_time>

    </request>

    <!-- 有N个这样的request节点 -->

  </requests>

</instance>

这里稍微解释一下为什么nodes节点的数目会比requests节点多1个。这是因为nodes节点包括了顾客节点(N个)和仓库节点(1个),而requests属性只属于顾客节点。

我是把xml文件中的这些数据读入到类对象数组中,每个类对象代表一个节点,类的定义如下:

// Customer.h

#ifndef _Customer_H

#define _Customer_H

class Customer{

public:

  Customer(int id=0, float x=0, float y=0, float startTime=0, float endTime=0, float quantity=0, float serviceTime=0);

  void setId(int id);  // 设置成员id的值

  void setX(float x);  // 设置成员x的值

  void setY(float y);  // 设置成员y的值

  void setStartTime(float startTime); // 设置成员startTime的值

  void setEndTime(float endTime);   // 设置成员endTime的值

  void setQuantity(float quantity);  // 设置成员quantity的值

  void setServiceTime(float serviceTime); // 设置成员serviceTime的值

  void show(); // 显示顾客节点信息

private:

  int id;

  float x;

  float y;

  float startTime;

  float endTime;

  float quantity;

  float serviceTime;

};

#endif

OK,那么现在开始贴一下main.cpp代码(Customer.cpp比较简单,就不贴了)

// main.cpp

#include "Customer.h"

#include "tinystr.h"

#include "tinyxml.h"

#include<iostream>

#include<vector>

#include<string>

#include<stdlib.h>

#include<iomanip>

using namespace std;

static const int NUM_OF_CUSTOMER = 51;    //顾客数量

static const char* FILENAME = "RC101_050.xml"; //文件名

int main(){

  vector<Customer *> customerSet(0); // 顾客集,每个元素是Customer对象的指针

  int i,j,k,count;

  int temp1;  // 存放整型数据

  float temp2; // 存放浮点型数据

  Customer* customer;  // 临时顾客节点指针

  for (i=0; i<NUM_OF_CUSTOMER; i++) { // 先初始化顾客集

    customer = new Customer();

    customerSet.push_back(customer);

  }

  TiXmlDocument doc(FILENAME);  // 读入XML文件

  if(!doc.LoadFile()) return -1; // 如果无法读取文件,则返回

  TiXmlHandle hDoc(&doc);     // hDoc是&doc指向的对象

  TiXmlElement* pElem;      // 指向元素的指针

  pElem = hDoc.FirstChildElement().Element(); //指向根节点

  TiXmlHandle hRoot(pElem);    // hRoot是根节点

  // 读取x,y,它们放在network->nodes->node节点中

  TiXmlElement* nodeElem = hRoot.FirstChild("network").FirstChild("nodes").FirstChild("node").Element(); //当前指向了node节点

  count = 0; // 记录移动到了哪个node节点,并且把该node节点的信息录入到顺序对应的customer中

  for(nodeElem; nodeElem; nodeElem = nodeElem->NextSiblingElement()) { // 挨个读取node节点的信息

    customer = customerSet[count]; // 当前顾客节点,注意不能赋值给一个新的对象,否则会调用复制构造函数

    TiXmlHandle node(nodeElem); // nodeElem所指向的节点

    TiXmlElement* xElem = node.FirstChild("cx").Element(); // cx节点

    TiXmlElement* yElem = node.FirstChild("cy").Element(); // cy节点

    nodeElem->QueryIntAttribute("id", &temp1); //把id放到temp1中,属性值读法

    customer->setId(temp1);     

    temp2 = atof(xElem->GetText());  // char转float

    customer->setX(temp2);

    temp2 = atof(yElem->GetText());

    customer->setY(temp2);

    count++;

  }

  // 读取其余信息

  TiXmlElement* requestElem = hRoot.FirstChild("requests").FirstChild("request").Element(); // 指向了request节点

  count = 1;

  for(requestElem; requestElem; requestElem = requestElem->NextSiblingElement()) {

    customer = customerSet[count];   // 当前顾客节点,注意不能赋值给一个新的对象,否则会调用复制构造函数

    TiXmlHandle request(requestElem); // 指针指向的对象

    TiXmlElement* startTimeElem = request.FirstChild("tw").FirstChild("start").Element(); // start time

    TiXmlElement* endTimeElem = request.FirstChild("tw").FirstChild("end").Element();   // end time

    TiXmlElement* quantityElem = request.FirstChild("quantity").Element();        // quantity

    TiXmlElement* serviceTimeElem = request.FirstChild("service_time").Element();     // service time

    // 分别读取各项数据

    temp2 = atof(startTimeElem->GetText());

    customer->setStartTime(temp2); 

    temp2 = atof(endTimeElem->GetText());

    customer->setEndTime(temp2);

    temp2 = atof(quantityElem->GetText());

    customer->setQuantity(temp2);

    temp2 = atof(serviceTimeElem->GetText());

    customer->setServiceTime(temp2);

    count++;

  }

  // 将读取到的信息输出到控制台

  cout<<setiosflags(ios_base::left)<<setw(6)<<"id"<<setw(6)<<"x"<<setw(6)<<

    "y"<<setw(12)<<"startTime"<<setw(12)<<"endTime"<<setw(12)<<"quantity"<<setw(14)<<"serviceTime"<<endl;

  for(i=0; i<NUM_OF_CUSTOMER; i++) {

    customer = customerSet[i];

    customer->show();

  }

  system("pause");

  return 0;

}

在解释main.cpp的内容之前,先解释一下一些数据类型(只是个人理解,欢迎纠错):

  • TiXmlDocument:文件节点,把Xml文件的内容读入到该类型变量中
  • TiXmlElement*:指向节点的指针
  • TiXmlHandle:节点的实例,也就是TiXmlElement所指向的对象
  • FirstChild("nodeName"):第一个名字为“nodeName”的子节点
  • NextSiblingElement():下一个兄弟节点元素,它们有相同的父节点
  • QueryIntAttribute("attributeName", &var):把节点属性名为attributeName的属性值以int类型赋值给var变量
  • GetText():获取当前节点元素的内容,即包含在<node>text</node>中的text

OK,有了以上一些简单的知识积累,就可以很方便地读取Xml文件了,现在截取xml的部分来讲解:

<instance>

  <network>

    <nodes>

      <node id="0" type="0">

        <cx>40.0</cx>

        <cy>50.0</cy>

      </node>

    <!-- 有N+1个这样的node节点 -->

    </nodes>  

  </network>

  .....

</instance>

在这部分我们会把顾客的id,坐标x,y都读入到Customer对象中。 

1. 首先我们得到了文件节点hDoc,现在我们要进入根节点"instance":

TiXmlElement* pElem;      // 指向元素的指针

pElem = hDoc.FirstChildElement().Element(); //指向根节点

TiXmlHandle hRoot(pElem);    // hRoot是根节点

根节点"instance"是文件节点的第一个子节点,所以用 pElem = hDoc.FirstChildElement().Element() 就可以使得指针pElem指向"instance",hRoot是pElem所指向的对象。

2. 现在我们需要进入到“node”节点中,遍历其兄弟节点,将所有数据读入。下面的语句可以将第一个“node”节点的指针赋值给nodeElem:

TiXmlElement* nodeElem = hRoot.FirstChild("network").FirstChild("nodes").FirstChild("node").Element(); //当前指向了node节点

节点的id值放在"node"节点的属性"id"中:

nodeElem->QueryIntAttribute("id", &temp1); //把id放到temp1中,属性值读法

然后坐标x, y的值放在“node”节点的子节点"cx"和"cy"的内容(text)中,所以我们这样来读取:

TiXmlElement* xElem = node.FirstChild("cx").Element(); // cx节点

temp2 = atof(xElem->GetText());  // char转float

函数atof在库<stdlib>中,用以将char数组转化为浮点数。

通过1,2两步,我们已经把第一个“node”节点的id, x, y的值读入到对象中,然后只需要把遍历所有的兄弟节点即可:

for(nodeElem; nodeElem; nodeElem = nodeElem->NextSiblingElement()) {

......

}

读入requests节点下的startTime, endTime, quantity, serviceTime等值的方法也是一样的,详情参考main.cpp代码。

运行结果如下:

总结:

其实说白了读取Xml文件的关键在于:

  • 移动指针到所要读取数据的节点中; 
  • 若是读取属性值,则使用QueryIntAttribute方法直接读取;
  • 若读取的是节点的内容,则使用getText()方法读取;
  • 连续的数据具有兄弟节点关系,使用NextSiblingElement()方法来指向下一个兄弟节点

 后记:

这篇博文只介绍了如何读取Xml文件,至于如何写入Xml文件,请参考tinyXml的官方教程,讲的特别清楚,特别良心。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • C++遍历文件夹下文件的方法

    本文实例讲述了C++遍历文件夹下文件的方法.分享给大家供大家参考.具体如下: #include <windows.h> #include <stdio.h> #include <string.h> #define LEN 1024 // 深度优先递归遍历目录中所有的文件 BOOL DirectoryList(LPCSTR Path) { WIN32_FIND_DATA FindData; HANDLE hError; int FileCount = 0; char Fi

  • 深入理解C++中的文件操作

    前言 我们在编写程序的时候,最密不可分的就是对文件进行相应的操作,我们可以从文件中读取数据,可以将数据保存到文件,可以-- 总而言之,言而总之,一言以蔽之,对文件的操作是非常重要的,下面我们就来介绍一下C++中是如何对文件进行操作的.C++ 通过以下几个类支持文件的输入输出: ofstream: 写操作(输出)的文件类 (由ostream引申而来) ifstream: 读操作(输入)的文件类(由istream引申而来) fstream: 可同时读写操作的文件类 (由iostream引申而来) 打

  • c++实现逐行读取配置文件写入内存的示例

    不解析配置内容,只读取文件内容,剪去注释和首尾空格后写入缓存: vector<string> 中.供其他方法使用.代码是在做一个MFC小工具时写的. ReadProtocol.h 复制代码 代码如下: /*** 从文件中 读取 protocol 的内容 写入缓存* 供外部方法使用* Alex Liu, 2014*/ #pragma once #include <vector>#include <map>#include <list>#include <

  • C++中头文件的概念与基本编写方法

    1 标准库中的头文件 C++标准库中的一切内容都被放在名字空间std中(名字空间中的内容对外是不可见的),但是带来了一个新问题,无数现有的C++代码都依赖于使用了多年的伪标准库中的功能,如声明在<iostream.h>等头文件中的功能,使用std包装标准库导致现有代码的不可用,为了兼容这种情况,标准委员会为包装了std的那部分标准库创建了新的头文件,新的头文件的文件名与旧的一样,只是没有.h这个后缀,如<iostream.h>就变成了<iostream>.对于C头文件,

  • 详解C++编程中对二进制文件的读写操作

    二进制文件不是以ASCII代码存放数据的,它将内存中数据存储形式不加转换地传送到磁盘文件,因此它又称为内存数据的映像文件.因为文件中的信息不是字符数据,而是字节中的二进制形式的信息,因此它又称为字节文件. 对二进制文件的操作也需要先打开文件,用完后要关闭文件.在打开时要用ios::binary指定为以二进制形式传送和存储.二进制文件除了可以作为输入文件或输出文件外,还可以是既能输入又能输出的文件.这是和ASCII文件不同的地方. 用成员函数read和write读写二进制文件 对二进制文件的读写主

  • C++中输入输出流及文件流操作总结

    本文实例为大家分享了C++中输入输出流及文件流操作笔记,供大家参考,具体内容如下 1.流的控制 iomanip          在使用格式化I/O时应包含此头文件.     stdiostream   用于混合使用C和C + +的I/O机制时,例如想将C程序转变为C++程序 2.类继承关系 ios是抽象基类,由它派生出istream类和ostream类, iostream类支持输入输出操作,iostream类是从istream类和ostream类通过多重继承而派生的类 类ifstream继承了

  • C/C++ 读取16进制文件的方法

    1.为什么有这种需求 因为有些情况需要避免出现乱码.不管什么编码都是二进制的,这样表示为16进制就可以啦. 2.如何读取16进制文件 最近编程用这一问题,网上查了一下,感觉还是自己写吧. 16进制数据一般是:text=0x340xb5...,就是0x开头,之后是两个数字十六进制数. 如果直接使用sscanf(text,"0x",&num),会把连续的数字读进去直到遇到'x'. 如使用sscanf读取text第一个读到的十六进制数是0x340,误判啦.最后,因为是4个一组,就先把

  • 解读C++编程的相关文件操作

    C++文件的概念 迄今为止,我们讨论的输入输出是以系统指定的标准设备(输入设备为键盘,输出设备为显示器)为对象的.在实际应用中,常以磁盘文件作为对象.即从磁盘文件读取数据,将数据输出到磁盘文件.磁盘是计算机的外部存储器,它能够长期保留信息,能读能写,可以刷新重写,方便携带,因而得到广泛使用. 文件(file)是程序设计中一个重要的概念.所谓"文件",一般指存储在外部介质上数据的集合.一批数据是以文件的形式存放在外部介质(如磁盘.光盘和U盘)上的.操 作系统是以文件为单位对数据进行管理的

  • 详解C++文件读写操作

    在看C++编程思想中,每个练习基本都是使用ofstream,ifstream,fstream,以前粗略知道其用法和含义,在看了几位大牛的博文后,进行整理和总结: 这里主要是讨论fstream的内容: #include <fstream> ofstream //文件写操作 内存写入存储设备 ifstream //文件读操作,存储设备读区到内存中 fstream //读写操作,对打开的文件可进行读写操作 1.打开文件 在fstream类中,成员函数open()实现打开文件的操作,从而将数据流和文件

  • C++实现多线程查找文件实例

    主要是多线程的互斥 文件 的查找 多线程互斥的框架 复制代码 代码如下: //线程函数  UINT FinderEntry(LPVOID lpParam)  {      //CRapidFinder通过参数传递进来       CRapidFinder* pFinder = (CRapidFinder*)lpParam;      CDirectoryNode* pNode = NULL;      BOOL bActive = TRUE; //bActive为TRUE,表示当前线程激活   

随机推荐