正则表达式判断字符有乱码(正则文法转正则表达式)

#include<QtCore/QCoreApplication>#include<iostream>#include<string>#include<regex>usingnamespacestd;intmain(intargc,char*argv[]){ QCoreApplicationa(argc,argv); boolfoundmatch=false; try{ std::wregexre(L

大家好,又见面了,我是你们的朋友全栈君。

使用std::wregex

#include <QtCore/QCoreApplication>
#include <iostream>
#include <string>
#include <regex>

using namespace std;

int main(int argc, char *argv[])
{ 
   
	QCoreApplication a(argc, argv);
	bool foundmatch = false;
	try { 
   
		std::wregex re(LR"([a-zA-Z]:\\[\.\w-_\u4e00-\u9fa5\\]*)"); //windows文件夹路径
		std::wstring subject = L"D:\\Tools\\软件\\xournalpp-1.0.17-windows";
		foundmatch = std::regex_search(subject, re);
		cout << foundmatch << endl;
	}
	catch (std::regex_error& e) { 
   
		cout << e.what() << endl;
	}
	return a.exec();
}

以上方式存在缺陷,不支持Unicode scrpt。(\p{IsScript} for Unicode scripts)
在这里插入图片描述

使用qt框架下的QJSEngine类:

在c++中运行js脚本执行正则匹配:

#include <QtCore/QCoreApplication>
#include <QJSEngine>
#include <QDebug>
#include <QFile>
#include <QTextStream>

using namespace std;

int main(int argc, char *argv[])
{ 
   
	QCoreApplication a(argc, argv);
	QJSEngine js;
	QJSValue module = js.importModule("D:/tcl_me/math.mjs");
	QJSValue sumFunction = module.property("sum");
	QString str = "38u48djhfod中国,@##@!_)+bia發財";
	QJSValueList args;
	args << str;
	QJSValue result = sumFunction.call(args);
	if (result.isError())
	{ 
   
		qDebug() << result.toString();
		return -1;
	}
	qDebug() << result.toBool();
	return a.exec();
}

使用的js脚本代码(math.mjs):

export function sum(subject) { 
   
	var reg = /[\p{Han}]+/g;
    var ret = subject.match(reg);
    return ret;
}

运行结果:
在这里插入图片描述
匹配成功。

期间测试过PCRE、PCRE2,Boost::regex,POCO::RegularExpression、Googel::RE2效果均不佳,根本原因是c++语言本身对Unicode的支持欠佳,需要使用ICU通用组件库配合Boost::regex,并且Boost::regex默认ICU不参加编译,十分麻烦。
QJSEngine搭载V8引擎,执行js脚本相当快。故采用c++和js脚本混合编程快速解决“c++正则表达式匹配中文”产生的一系列问题。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/128169.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • numpy创建数组

    numpy创建数组数组的操作list======特殊的数组数组和列表的区别:数组:存储的时同一种数据类型;list:容器,可以存储任意数据类型;一维数组和数组的计算:#一维数组和数组的计算a=[1,2,3,4]b=[2,3,4,5]#一维数组相加add=lambdax:x[0]+x[1]#[(1,2),(2,3),(3,4),(4,…

    2022年6月7日
    30
  • MySQL之权限管理

    MySQL之权限管理MySQL之权限管理

    2022年4月24日
    51
  • break和continue return_break语句和continue语句的区别

    break和continue return_break语句和continue语句的区别前言一般刚开始遇到这三个关键字,都会有点乱,return还好,特别是break和continue,特别容易搞混,所以这里记录一下正文 1、return:直接跳出当前的方法,返回到该调用的方法的语句处,继续执行 2. break:在循环体内结束整个循环过程 3. continue:结束本次的循环,直接进行下一次的循环测试 这样说还

    2025年9月5日
    6
  • git查看分支创建时间_git版本分支图怎么看

    git查看分支创建时间_git版本分支图怎么看git查看分支创建时间gitreflogshow–date=iso<branchname>可以查看到指定分支的历次更改记录,最下面一条的时间即是分支创建时间。

    2022年10月1日
    3
  • OFDM调制matlab仿真详细代码

    OFDM调制matlab仿真详细代码MATLAB仿真代码%==================================================%作者:肆拾伍%时间:11/302019%版本:V3%=================OFDM仿真参数说明:================%%子载波数carrier_count—200%总符号数symbol_count…

    2022年6月4日
    25
  • java queryinterface_COM编程中的接口查询QueryInterface的实现原理

    java queryinterface_COM编程中的接口查询QueryInterface的实现原理我们都知道,COM组件编程中,QueryInterface实现的接口之间的查询,通过这个接口,我们可以获取该组件中其他的接口。但是,QueryInterface实现的原理,并不是大家都很清楚,也没有哪本书仔细讲了这点。我将个人心得写下来,供有需要的人查看。首先,我们看一下基本的COM实现。一般来说,COM是通过多继承实现多个接口,如下图而对应的QueryInterface实现如下HRESULT…

    2022年7月22日
    11

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号