用xerces-c来进行xml schema校验「建议收藏」

用xerces-c来进行xml schema校验

大家好,又见面了,我是全栈君。

在xerces-c的官方站点上有文章指引说明是怎样进行xml schema校验。

http://xerces.apache.org/xerces-c/schema-3.html

给出的样例代码:

// Instantiate the DOM parser.
XercesDOMParser parser;
parser.setDoNamespaces(true);
parser.setDoSchema(true);
parser.parse(xmlFile);

但。样例代码根本不起不论什么作用。

在调用XercesDOMParser::parse之前,还有两件事情要做:

1.调用XercesDOMParser::setValidationScheme来设置校验计划

parser.setValidationScheme( XercesDOMParser::Val_Auto);

parser.setValidationScheme( XercesDOMParser::Val_Always);

2.要调用XercesDOMParser::setErrorHandler, 当中參数必须是ErrorHandler类或子类的对象。

看以下样例

address.xml:

<?xml version="1.0" encoding="utf-8"?

><Address xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="address.xsd"> <Recipient>Mr. Walter C. Brown</Recipient> <House>good</House> <Street>Featherstone Street</Street> <Town>LONDON</Town> <PostCode>EC1Y 8SY</PostCode> <Country>UK</Country></Address>

address.xsd:

<?xml version="1.0" encoding="utf-8"?

><xs:schema elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema"> <xs:element name="Address"> <xs:complexType> <xs:sequence> <xs:element name="Recipient" type="xs:string" /> <xs:element name="House" type="xs:string" /> <xs:element name="Street" type="xs:string" /> <xs:element name="Town" type="xs:string" /> <xs:element name="County" type="xs:string" minOccurs="0" /> <xs:element name="PostCode" type="xs:unsignedInt" /> <xs:element name="Country" minOccurs="0"> <xs:simpleType> <xs:restriction base="xs:string"> <xs:enumeration value="IN" /> <xs:enumeration value="DE" /> <xs:enumeration value="ES" /> <xs:enumeration value="UK" /> <xs:enumeration value="US" /> </xs:restriction> </xs:simpleType> </xs:element> </xs:sequence> </xs:complexType> </xs:element></xs:schema>

new_address.cpp:

#include <stdio.h>
#include <xercesc/parsers/XercesDOMParser.hpp>
#include <xercesc/sax/SAXException.hpp>
#include <xercesc/dom/DOMException.hpp>
#include <xercesc/dom/DOMElement.hpp>
#include <xercesc/dom/DOMLSException.hpp>
#include <xercesc/sax2/DefaultHandler.hpp>

using namespace XERCES_CPP_NAMESPACE;

class SchemaErrorHandler : public DefaultHandler
{
	public:
		SchemaErrorHandler() {}
		~SchemaErrorHandler() {}

	void warning(const SAXParseException& exc)
	{
		printf( "warn in line:%lu, col:%lu, %s\n", 
				exc.getLineNumber(), exc.getColumnNumber(),
				XMLString::transcode( exc.getMessage()) );
	}

    void error(const SAXParseException& exc)
	{
		printf( "error in line:%lu, col:%lu, %s\n", 
				exc.getLineNumber(), exc.getColumnNumber(),
				XMLString::transcode( exc.getMessage()) );
	}

    void fatalError(const SAXParseException& exc)
	{
		printf( "fatal in line:%lu, col:%lu, %s\n", 
				exc.getLineNumber(), exc.getColumnNumber(),
				XMLString::transcode( exc.getMessage()) );
	}

    void resetErrors()
	{
		printf( "nothing\n" );
	}
};

int main(int argc, char* argv[] )
{
	if ( argc < 2 )
	{
		printf( "must specify a file\n" );
		return -1;
	}

	XMLPlatformUtils::Initialize();

	XercesDOMParser parser;
	SchemaErrorHandler handler;
	try
	{
		parser.setErrorHandler( &handler );
		parser.setDoNamespaces(true);
		parser.setDoSchema(true);
		//parser.setValidationScheme( XercesDOMParser::Val_Auto);
		parser.parse( argv[1] );
	} catch ( SAXException& e )
	{
		printf( "msg:%s\n", XMLString::transcode(e.getMessage() ) );
		return -2;
	}
	catch ( XMLException& e )
	{
		printf( "code:%d, msg:%s\n", e.getCode(), XMLString::transcode( e.getMessage() ) );
		return -3;
	}
	catch (	DOMException& e )
	{
		printf( "code:%d, msg:%s\n", e.code, e.msg );
		return -4;
	}

	return 0;
}

能够看到这里的代码凝视掉了这一行:

//parser.setValidationScheme( XercesDOMParser::Val_Auto);

编译执行:

[xuzhina@localhost sample]$ g++ -g -o new_address new_address.cpp -lxerces-c
[xuzhina@localhost sample]$ ./new_address address.xml 
[xuzhina@localhost sample]$ 

//parser.setValidationScheme( XercesDOMParser::Val_Auto);

打开,但凝视掉

parser.setErrorHandler( &handler );

编译执行:

[xuzhina@localhost sample]$ g++ -g -o new_address new_address.cpp -lxerces-c
[xuzhina@localhost sample]$ ./new_address address.xml 
[xuzhina@localhost sample]$ 

parser.setErrorHandler( &handler );

打开,编译执行:

[xuzhina@localhost sample]$ ./new_address address.xml 
error in line:8, col:31, value 'EC1Y 8SY' does not match regular expression facet '[+\-]?[0-9]+'

执行一下xmllint,对照一下结果:

[xuzhina@localhost sample]$ xmllint --schema address.xsd address.xml
<?xml version="1.0" encoding="utf-8"?>
<Address xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="address.xsd">
	<Recipient>Mr. Walter C. Brown</Recipient>
	<House>good</House>
	<Street>Featherstone Street</Street>
	<Town>LONDON</Town>
	<PostCode>EC1Y 8SY</PostCode>
	<Country>UK</Country>
</Address>
address.xml:8: element PostCode: Schemas validity error : Element 'PostCode': 'EC1Y 8SY' is not a valid value of the atomic type 'xs:unsignedInt'.
address.xml fails to validate

PS:

在xml schema中,string是兼容其他类型,比方在House标签的内容写上数字,比方49,不管xmllint, 还是xerces都不会报这个标签的值有问题。

以前为这个问题折腾一个下午。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/116169.html原文链接:https://javaforall.net

(0)
上一篇 2022年1月25日 上午8:00
下一篇 2022年1月25日 上午8:00


相关推荐

  • h5实现长按复制文本_复制css

    h5实现长按复制文本_复制css复制2333333<style> p{ -webkit-user-select:none; user-select:none; } p>i{ -webkit-user-select:text; user-select:text; } </style> <p>长按复制短码<i>23…

    2026年4月15日
    4
  • recovery分区可以删除吗,recovery lmage分区

    recovery分区可以删除吗,recovery lmage分区

    2026年3月13日
    2
  • Annotation注解

    Annotation注解Annotation 称为注释或注解 它是一个接口 注解提供了一种为程序元素 类 方法 成员变量等 设置元数据 描述其它数据的数据 的方法 编译器 开发工具或其它程序中可以通过反射来获取程序中的 Annotation 对象 通过该对象获得注解里的元数据 注解不影响程序代码 通过使用注解可以在不改变程序逻辑的情况下 在源文件中嵌入一些补充信息 1 基本注释 Override 表明该方

    2026年2月2日
    2
  • pycharm运行pyspider

    pycharm运行pyspider系统环境 win7 10python3 7pycharm2019 2 本文不含内容 python 安装 pycharm 安装以及破 jie 设置 pythonpip 国内镜像使用 PycharmClone 访问 Pyspider 项目地址 https github com binux pyspider 拿到项目 giturl https github com binux

    2026年3月27日
    2
  • 永久设置python清华镜像源_清华开源镜像站怎么用

    永久设置python清华镜像源_清华开源镜像站怎么用Python配置清华镜像源1.前言使用pip安装服务器在国外的python库时,下载需要很长时间,在配置文件中设置国内镜像可以提高速度,清华镜像源就是其中之一。2.pypi镜像使用帮助网址:https://mirrors.tuna.tsinghua.edu.cn/help/pypi/3.临时配置若只是临时下载一个python库的话,则可使用以下命令进行配置:pipinstal…

    2022年10月21日
    7
  • pycharm全文搜索_pycharm查找快捷键

    pycharm全文搜索_pycharm查找快捷键在pycharm中如何全局搜索关键词

    2022年8月28日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号