php开发中处理emoji表情和颜文字的兼容问题

php开发中处理emoji表情和颜文字的兼容问题

背景:
随着手机的普及,现在移动开发很火爆,已经远远超过了pc端。
在移动设备经常会发生用户发送的内容中包含emoji表情,在显示时就是乱码。
一般是因为Mysql表设计时,都是用UTF8字符集的。把带有emoji的昵称字段往里面insert一下就没了,整个字段变成了空字符串。
这是因为Mysql的utf8字符集是3字节的,而emoji是4字节,这样整个昵称就无法存储了。

现在介绍在PHP开发中涉及到emoji表情的三种处理方法:
1)使用utf8mb4字符集
如果你的mysql版本>=5.5.3,你大可直接将utf8直接升级为utf8mb4字符集
这种4字节的utf8编码可完美兼容旧的3字节utf8字符集,并且可以直接存储emoji表情,是最好的解决方案
至于字节增大带来的性能损耗,我看过一些评测,几乎是可以忽略不计的

2)使用base64编码
如果你因为某些原因无法使用utf8mb4的话,你还可以使用base64来曲线救国
使用例如base64_encode之类的函数编码过后的emoji可以直接存储在utf8字节集的数据表中,取出时base64_decode一下即可

3)去掉emoji表情
在iOS以外的平台上,例如PC或者android。如果你需要显示emoji,就得准备一大堆emoji图片并使用第三方前端类库才行。
emoji表情是个麻烦的东西,即使你能存储,也不一定能完美显示,所以我们可以将它过滤掉。
在google里找到能用的过滤的代码,如下:

// 过滤掉emoji表情
function filterEmoji($str)
{
 $str = preg_replace_callback(
   '/./u',
   function (array $match) {
    return strlen($match[0]) >= 4 ? '' : $match[0];
   },
   $str);
  return $str;
 }

当然你也可以直接在客户端过滤,禁止输入表情和颜文字。这样更加直接有效。

总结:
我个人在App开发中也遇到了这个问题,权衡对比了一下三个方法。
方法一是改字符集编码, 这个成本有一点高,而且怕改了后影响其他的程序,所以忽略了这个方法。
方法三,可以过滤Emoji表情,但是不能对颜文字进行过滤,也不能满足所有需求。因为Mysql的utf8字符集是3字节的,而emoji是4字节,数据库还是不能保存。
综合考虑所以最后选择base64编码。这个方法比较简单,对于Emoji表情和颜文字也都兼容。
只是写入的时候要base64_encode,读取的时候要base64_decode一下。
base64的缺点就是每次读数据还得base64_decode一下,而且保存的数据不直观。
但是相对我们的情况,这个方法是最靠谱的。风险小也能解决问题。
当然也可以直接在客户端过滤,禁止输入表情和颜文字,这样更加直接有效。但是这得重新发包,不能及时解决问题。

效果图如下:

ios:
php开发中处理emoji表情和颜文字的兼容问题

andriod:

php开发中处理emoji表情和颜文字的兼容问题

 

原文:https://blog.csdn.net/ly_dengle/article/details/52943669

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/112649.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 电磁兼容实验室「建议收藏」

    电磁兼容实验室「建议收藏」南京信息工程大学电磁兼容实验室南京信息工程大学电子与信息工程学院[1]电磁兼容实验室依托“江苏省传感网与现代气象装备”优势学科,‘江苏省信息与通信工程’优势学科,“江苏省气象探测与信号处理重点实验室”,“江苏省气象传感网技术工程中心”,成立于2012年10月[2]。电磁兼容暗室设计频率范围:10kHz-18GHz;暗室经过203所验收合格。可以满足国军标151A/151B-2013军标9项测试标准,民标多项测试,具体测试项目如下:GJB151B测试项目:25Hz~10kHz电源线传导发…

    2025年7月26日
    3
  • 网络安全工具使用集锦手册下载_网络安全科普书籍

    网络安全工具使用集锦手册下载_网络安全科普书籍常用工具:Nmap使用详解 Sqlmap使用详解 CobaltStrike的使用 MetasploitFramework(MSF)的使用 CobaltStrike上线微信提醒 CobaltStrike的argue参数污染绕AV CobaltStrike证书修改躲避流量审查 CobaltStrike上线Linux主机(CrossC2)域内工具:Linux下使用ldapsearch进行域信息查询 ADExplorer和TheLDAPExplorer工具的用法 ADSI(Act

    2022年10月19日
    1
  • python中for循环的用法-Python for循环及基础用法详解

    python中for循环的用法-Python for循环及基础用法详解Python中的循环语句有2种,分别是while循环和for循环,前面章节已经对while做了详细的讲解,本节给大家介绍for循环,它常用于遍历字符串、列表、元组、字典、集合等序列类型,逐个获取序列中的各个元素。for循环的语法格式如下:for迭代变量in字符串|列表|元组|字典|集合:代码块格式中,迭代变量用于存放从序列类型变量中读取出来的元素,所以一般不会在循环中…

    2022年8月12日
    20
  • zigzag扫描matlab,ZIGZAG扫描的MATLAB实现

    zigzag扫描matlab,ZIGZAG扫描的MATLAB实现转自阿须数码,用MATLAB实现MPEG中的ZIG-ZAG扫描。觉得有点研究价值,实现的方法也很巧妙。下面给一个参照MPEG提供的方法:===functionb=zigzag(a)%这是参照UniversityofCalifornia提供的MPEG源代码的基础上编制的。%Copyright(c)1995TheRegentsoftheUniversityofC…

    2025年8月24日
    3
  • Layui弹出层 加载 做编辑页面「建议收藏」

    Layui弹出层 加载 做编辑页面「建议收藏」先上效果图基本准备,引入layui的layui.css,layui.js文件<linkrel="stylesheet"href="../../../Publics/others/layui/css/layui.css"media="all"><scriptsrc="../../../Publics/others/layui/layui.js">&a

    2022年5月26日
    69
  • f1 score 代码_f1 score loss 实现问题「建议收藏」

    f1 score 代码_f1 score loss 实现问题「建议收藏」在paddle上实现了一个f1loss函数:def_compute_loss(self,dec_output):tp=fluid.layers.sum(fluid.layers.cast(self.label*dec_output,dtype=”float32″))tn=fluid.layers.sum(fluid.layers.cast((1-self.label)*…

    2022年10月14日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号