Qt 学习(2)

Qt 学习(2)

Qt 的 QXmlStreamReader

在 Qt 应用程序中访问 XML 格式的文件数据,可以使用 [QXmlStreamReader][sreamreader] 对文件进行读取。关于 QXmlStreamReder 的使用,官方文档中有 QXmlStream Bookmarks Example 的示例可供参考。

常用的方法有:

  • TokenType readNext()
    读取下一个标记并返回它的类型
  • bool readNextStartElement()
    在当前元素内,读取到下一个开始元素,若找到开始元素,就返回真,否则返回假
  • QXmlStreamAttributes attributes()
    返回 StartElement 中的属性
  • QString name()
    返回标签名,比如读取标签 <html> 就会返回 html
  • void skipCurrentElement()
    读取到当前元素的结尾,跳过它的子节点
  • QString readElementText()
    读取元素中间的文本,比如 <p>test</p> 将会返回 test

对于一个自定义结构的 XML 文件,文件名为 test.xml,如下:

<?xml version="1.0" encoding="UTF-8"?>
<Instructions version="2.0">
    <Instruct identifier="#" set="MSP">
        <row type="Offset" value="OFFSET_MODE">
            <reply type="String" enum="true">
                <accept value="AUTO" />
                <accept value="MANUAL" />
            </reply>
        </row>

        <row type="Buzzer" value="BUZZER" />

        <row type="AC" value="SAG">
            <reply type="Double" enum="false" bottom="0" />
        </row>

    </Instruct>
</Instructions>

首先构造一个 XmlStreamReader,它的构造函数可以接受一个 QIODevice 的指针,一般可以传递一个 QFile 指针,对 xml 文件进行解析:

// void InstructParser::parse(const QString &filename, const QString &set) {
    // 打开并读取指令文件
    QFile file( filename );
    bool opened = file.open( QIODevice::ReadOnly );
    if( !opened ) {
        qDebug() << "[parse] file not open" ;
        return;
    }
    m_xmlReader = new QXmlStreamReader( &file );

// ![1]
    readInstructions();
// ![1]

    file.close();
    file.deleteLater();
    delete m_xmlReader;
// }

构造了 XmlStreamReader 后,通过 readNext() 或者 readNextStartElement() 往下读取节点。

readNext 和 readNextStartElement 方法的使用有些差别,先来看看 readNext 方法:

// void  InstructParser::readInstructions()
    while( !m_xmlReader->atEnd() ) {
        m_xmlReader->readNext();
        qDebug() << "[readNext] "<< QString( "%0  %1").arg( m_xmlReader->lineNumber() ).arg( m_xmlReader->tokenString() ) << m_xmlReader->name().toString();
    }

输出结果:

read_next_output

可以看到,对于空白行, readNext 函数将会跳过该行,而对于第 3 行 Instruct 起始标签,在它的前面是有一个 tab 缩进的,这里会显示一个类型为 Characters 的元素,然而在第 18 行 </Instructions> 标签前面,其实并没有 tab 缩进,然而这里仍然会显示一个 Characters 元素,并且 17 行的反尖括号后面是没有输入字符的,不知道是不是 Windows 平台下的回车换行符当成一个元素来进行解析的。

接下来是 readNextElement 方法:

// void  InstructParser::readInstructions()
    while( !m_xmlReader->atEnd() ) {
        bool start = m_xmlReader->readNextStartElement();
        qDebug() << "[readNextStartElement] "<< start
                 << QString( "%0  %1").arg( m_xmlReader->lineNumber() ).arg( m_xmlReader->tokenString() )
                 << m_xmlReader->name().toString();
    }

输出结果:

read_next_start_element_output

可以看到,对于空白行,该方法仍然会忽略掉,但是这个方法不会再出现一些奇怪的 Characters 标签,所有打印出来的元素都是所需要的,当然最后读到文件尾会显示 Invalid 标记。这个方法比 readNext 方法更好用。但是需要注意的是在第 6 行,读取 <accept value="AUTO" /> 时,这里开始标签和结束标签是合并着写的,所以在读到结束标签时,该函数会返回 false,如果 while 循环的判断条件是 m_xmlReader->readNextStartElement(),那么当它遇到结束标签时,将会结束循环。

在读取 XML 文件时,不仅需要针对特定标签做处理,有时还需要注意各个标签之间的层级关系(常见的如 HTML 中 div 标签),如果像前面一样,直接判断 m_xmlReader 是不是到达文件底部,那么就没有办法找出标签之间的层级关系了。

为了找出某个标签中的子标签,就需要在进入标签后,继续用循环进行判断,比如对于上面的 XML 文件:在 InstructParser 中分别有四个方法读取四个标签:

private:
    void readInstructions(const QString &set);
    void readInstruct(const QString &set, const bool stillRead = false);
    void readRow();
    void readReply(Instruct *ins);

readInstructions 中使用 while 循环对 readInstruct 进行重复调用,在 readInstruct() 中使用 while 循环对 readRow() 进行重新调用……最后其实得到的是一个树状结构,在 readInstruct() 中:

    while( m_xmlReader->readNextStartElement() ) {
        if( m_xmlReader->name() == "row" ) {
            readRow();
        }
        else
            m_xmlReader->skipCurrentElement();
    }

在读取之前加上相应的输出语句:

qDebug() << "[reply]" << m_xmlReader->name() << m_attrib.value( "type" ) << m_xmlReader->tokenString();

可以得到以下输出:

qDebug

这样就得到了所有的节点,有时 m_xmlReader->readNextStartElement() 会跳出循环,可以在 readRow 等函数的结尾加上,以便读取到当前父节点的结束标签:

m_xmlReader->readElementText();  // skip to end tag of reply
posted @ 2018-06-16 19:20  brifuture  阅读(627)  评论(0编辑  收藏  举报