mysql 过滤微信昵称表情符号_js 过滤微信昵称的表情符号

mysql 过滤微信昵称表情符号_js 过滤微信昵称的表情符号我先说一下我的解决方法://示例名称:varstr=”阿bc?d的fg?hm天l”;//将名称拆分为数组,注意:这样会将表情拆分为两项,其值为代理对.//并且因为,代理对无法被浏览器识别,所以它们的值可能会被转化为U+feffvarstrArr=str.split(“”),result=””,totalLen=0;for(varidx=0;idx<s…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

我先说一下我的解决方法:

// 示例名称:

var str = “阿bc?d的fg?hm天l”;

// 将名称拆分为数组,注意: 这样会将表情拆分为两项,其值为代理对.

// 并且因为,代理对无法被浏览器识别,所以它们的值可能会被转化为 U+feff

var strArr = str.split(“”),

result = “”,

totalLen = 0;

for(var idx = 0; idx < strArr.length; idx ++) {

// 超出长度,退出程序

if(totalLen >= 16) break;

var val = strArr[idx];

// 英文,增加长度1

if(/[a-zA-Z]/.test(val)) {

totalLen = 1 + (+totalLen);

result += val;

}

// 中文,增加长度2

else if(/[\u4e00-\u9fa5]/.test(val)) {

totalLen = 2 + (+totalLen);

result += val;

}

// 遇到代理字符,将其转换为 “口”, 不增加长度

else if(/[\ud800-\udfff]/.test(val)) {

// 代理对长度为2,

if(/[\ud800-\udfff]/.test(strArr[idx + 1])) {

// 跳过下一个

idx ++;

}

// 将代理对替换为 “口”

result += “口”;

}

};

再说一下我的思路:

1) 首先我知道,这些表情其实也是一种文字,它可以看做某个UTF-16 的码点.可以参见这个附录:

2) 这些表情的码点在UTF-16中是有自己的范围的.而JS中可以通过正则表达式来检测一个文字的码点值

.从而判断它的类型,同理也可以用来判断它是不是 中文/英文等.在这个问题里,只需要判断其是否为中

文/英文即可.

3) 为什么是8个中文/16个英文啊?这到底是谁规定的? UTF8 是变长的,中文可能是 2-3个长度,UTF16 里面

中文和英文长度是一样的.所以我很想知道这个规则是干什么的?

PS: 这里的长度是编码单元长度,以 UTF16/UCS2 为例, 一个编码单元16位、2个字节,在UTF16下英文和中文

都是 U+0000 这样的形式,长度相等.除了部分代理对,它们的长度为2,占用32位、两个编码单元外(有无为3的我还

真不知道)。

欢迎大家来讨论.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/230608.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • pip常用命令以及升级方法

    pip常用命令以及升级方法pip常用命令以及升级方法使用python时经常使用到pip命令,可以方便安装python的各种第三方库1:查看pip打开cmd窗口,输入pip命令,会显示pip所有的参数使用方法如果输入pip提示Didnotprovideacommand,可能是没有配置环境变量导致的,也可能系统安装有多个pip2:查看pip的安装路径wherepip3:查看pip版本pip-V(注意V要大写)4:pip升级方法安装python第三方包时,会有pip版本的提示方法一:输入pipin

    2022年6月4日
    54
  • error: #5: cannot open source input file “xxx.h“: No such file or directory

    error: #5: cannot open source input file “xxx.h“: No such file or directoryerror:#5:cannotopensourceinputfile”xxx.h”:Nosuchfileordirectory关于新加一个.c文件编译后为何报错,是因为.h没有加进工程里面。只需要几步,然后找到.h文件所处的文件添加进去,编译,就不会报错了。…

    2022年7月14日
    14
  • 超全的英语短句汇集

    English900英语九百句常用职位英文译名超级短句成语集锦打开话匣子PC电脑词汇一百个绝佳句型李阳英语365句托福听力常用短语校园英语迷你惯用语洋话连篇至理名言English 900 英语九百句第一册一、 Greetings 问候语 1. hello! / hi! 你好! 2. good morning / afternoon / evening! 早晨(下午/晚上)好! 3. i

    2022年4月8日
    5.2K
  • traceroute详解[通俗易懂]

    traceroute详解[通俗易懂]traceroute详解1.traceroute基本概念traceroute(Windows系统下是tracert)命令利用ICMP协议定位您的计算机和目标计算机之间的所有路由器。TTL值可以反映数据包经过的路由器或网关的数量,通过操纵独立ICMP呼叫报文的TTL值和观察该报文被抛弃的返回信息,traceroute命令能够遍历到数据包传输路径上的所有路由器。traceroute是一条缓慢…

    2022年6月29日
    78
  • sql语句的各种模糊查询语句

    sql语句的各种模糊查询语句一般模糊语句如下:SELECT字段FROM表WHERE某字段Like条件其中关于条件,SQL提供了四种匹配模式:1、%:表示任意0个或多个字符。可匹配任意类型和长度的字符,有些情况下若是中文,请使用两个百分号(%%)表示。比如SELECT*FROM[user]WHEREu_nameLIKE‘%三%’将会把u_name为“张三”,“张猫三”、“三脚猫”,“唐三藏”等等有“

    2022年5月13日
    48
  • Android+NDK+OpenGLES开发环境配置

    Android+NDK+OpenGLES开发环境配置

    2022年1月6日
    46

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号