5分钟搞定敏感词过滤!

5分钟搞定敏感词过滤! 函数工作流(FunctionGraph,FGS)是一项基于事件驱动的函数托管计算服务,托管函数具备以毫秒级弹性伸缩、免运维、高可靠的方式运行。通过函数工作流,开发者无需配置和管理服务器,只需关注业务逻辑,编写函数代码,以无服务器的方式构建应用,便能开发出一个弹性高可用的后端系统,并按实际运行消耗的资源计费。极大地提高了开发和运维效率,减小了运作成本。 相比于传统的架构,函数服务构建的…

大家好,又见面了,我是你们的朋友全栈君。

 

函数工作流(FunctionGraph,FGS)是一项基于事件驱动的函数托管计算服务,托管函数具备以毫秒级弹性伸缩、免运维、高可靠的方式运行。通过函数工作流,开发者无需配置和管理服务器,只需关注业务逻辑,编写函数代码,以无服务器的方式构建应用,便能开发出一个弹性高可用的后端系统,并按实际运行消耗的资源计费。极大地提高了开发和运维效率,减小了运作成本。

 

相比于传统的架构,函数服务构建的无服务器架构具有如下优点:

1. 无需关注任何服务器,只需关注核心业务逻辑,提高开发和运维效率;

2. 函数运行随业务量弹性伸缩,按需付费,执行才计费,对于访问量波峰波谷非常明显的场景可以减少大量成本;

3. 通过简单的配置即可连通函数工作流和其它各云服务,通过事件触发函数,灵活易扩展;

 

为了进一步让大家感受函数工作流的优势,我们将介绍如何通过云函数快速构建一个无服务器的敏感词过滤系统,本文我们主要关注后端系统,前端的表现形式很多,大家可以自行构建。如下图,该系统会识别用户上传的文本内容是否包含敏感信息(如色情、政治等),并对这些词语进行过滤。

5分钟搞定敏感词过滤!

试想,如果我们通过传统的模式开发此应用,需要如何开发?

 

即使是基于现在的云平台,我们也仍需要购买云服务器,关注其规格、镜像、网络等各指标的选型和运维,然后在开发过程中可能还需要考虑与其他云服务的集成使用问题,使代码中耦合大量非业务代码,并且服务器等资源也并非是按需的,特别是对于访问量波峰波谷非常明显的场景,会造成大量多余的费用。

 

现在我们可以通过函数工作流服务来快速构建这个系统,并且完全无需关注服务器,且弹性伸缩运行、按需计费,如图:

http://functionstage-tutorial.obs-website.cn-north-1.myhwclouds.com/assets/images/ai.png

创建函数,在函数中调用华为云内容检测服务提供的文本检测接口,实现文本的敏感词检测,并为该函数配置一个APIG触发器,对外提供敏感词过滤的API,从而构建出一个完整的敏感词过滤的无服务器系统。客户端调用API,他会自动触发函数执行,而开发者编写的函数只需实现接收到文本之后如何处理文本的逻辑(调用内容检测服务服务)即可,最后将结果返回给客户端。至此,我们就构建了一个完整的无服务器敏感词过滤系统。

 

现在,我们将介绍如何端到端地将此无服务器系统构建出来。

1. 准备工作

进入华为云内容检测服务,申请开通文本内容检测,成功申请后边可以调用内容检测服务提供的文本检测接口了。

 

2. 创建函数

进入函数工作流服务页面,创建函数,实现文本检测的接口调用和敏感词过滤,代码如下(Python):

# -*- coding:utf-8 -*-

import json

import base64

import urllib

import urllib2

import ssl

import sys

 

reload(sys)

sys.setdefaultencoding(‘utf-8’)

 

def do_filter(msg,str_list):

    result = ”

    try:

        if len(str_list) <=0:

            return msg

        for str in str_list:

            str_tmp = msg.replace(str,”)

            msg = str_tmp

        result = msg

    except:

        print(“_do_filter catch an exception!”)

    return result

 

def filter(context, msg):

    result = ”

    try:

        ssl._create_default_https_context = ssl._create_unverified_context

       

        token = context.getToken();

        headers = {‘Content-Type’:’application/json;charset=utf8′,’X-Auth-Token’:token}

       

        url = “https://ais.cn-north-1.myhwclouds.com/v1.0/moderation/text”

       

        values = {}

        values[‘categories’] = [‘porn’,’ad’,’politics’,’abuse’,’contraband’]

        #msg = base64.b64encode(msg)

        item = {‘type’:’content’,’text’:msg}

        values[‘items’] = [item]

       

        data = json.dumps(values)

        print(“data: %s”%data)

       

        request = urllib2.Request(url,data,headers)

        rsp = urllib2.urlopen(request)

        http_rsp = rsp.read()

        print(“http response: %s” %http_rsp)

       

        json_rsp = json.loads(http_rsp)

        result = json_rsp[‘result’]

       

        suggestion = result[‘suggestion’]

        

        if suggestion == ‘pass’:

            print(“input msg have passed the checking!”)

            result = msg

        else:

            detail = result[‘detail’]

       

            if detail.has_key(‘porn’):

                list_porn = detail[‘porn’]

                msg = do_filter(msg,list_porn)

            if detail.has_key(‘ad’):

                list_ad = detail[‘ad’]

                msg = do_filter(msg,list_ad)

            if detail.has_key(‘politics’):

                list_politics = detail[‘politics’]

                msg = do_filter(msg,list_politics)

            if detail.has_key(‘abuse’):

                list_abuse = detail[‘abuse’]

                msg = do_filter(msg,list_abuse)

            if detail.has_key(‘contraband’):

                list_contraband = detail[‘contraband’]

                msg = do_filter(msg,list_contraband)

            result = msg

    except Exception, e:

        print e

        print(“filter catch an exception!”)

    return result

 

def handler (event, context):

    print(“message filter begin!”)

    result = “”

    response = {}

    http_method = event.get(‘httpMethod’)

   

    if http_method == ‘OPTIONS’:

        response = {

            ‘statusCode’: 200,

            ‘isBase64Encoded’: True,

            ‘headers’: {

                “Content-Type”: “application/json; charset=utf-8”,

                “Access-Control-Allow-Origin”: “*”,

                “Access-Control-Allow-Headers”: “Content-Type,Accept”,

                “Access-Control-Allow-Methods”: “GET,POST,PUT,DELETE”

            },

            ‘body’: base64.b64encode(‘{“result”:’+ ‘”‘ + result +'”}’),

        }

        return response

    body = event.get(‘body’)

    body_decode = base64.b64decode(body)

    json_object = json.loads(body_decode)

    msg = json_object[‘msg’]

   

    print(‘msg : %s’%msg)

   

    try:

        result = filter(context, msg)

        response = {

            ‘statusCode’: 200,

            ‘isBase64Encoded’: True,

            ‘headers’: {

                “Content-Type”: “application/json; charset=utf-8”,

                “Access-Control-Allow-Origin”: “*”,

                “Access-Control-Allow-Headers”: “Content-Type,Accept”,

                “Access-Control-Allow-Methods”: “GET,POST,PUT,DELETE”

            },

            ‘body’: base64.b64encode(‘{“result”:’+ ‘”‘ + result +'”}’),

        }

    except:

        print(“function catch an exception!”)

   

    return response

   

函数创建完成之后,为其配置具有IAM访问权限的委托,因为本函数代码中获取用户的ak、sk需要拥有访问IAM的权限。

 

3. 创建APIG触发器

为函数配置一个APIG触发器,这样便得到一个调用该函数的HTTP(S) API,供外部调用。

 

4. 测试

使用postman等工具向上一步中创建的APIG触发器的接口发送post请求,body体为:{
“msg”: 过滤检测的文本},查看返回信息。

比如发送 {“msg”: “just fuck …”}, 返回体为 {“result”: “just  …”}

 

自此,我们就完整地实现了一个无服务器的敏感词过滤后端系统。

欢迎体验!

https://www.huaweicloud.com/product/functiongraph.html?utm_source= zjqd&utm_medium=mediafree&utm_campaign=functiongraph&utm_content=article-0727-1

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/131468.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Eclipse安装中文简体语言包(官方下载安装教程)[通俗易懂]

    更新2020/1/26https://download.eclipse.org/technology/babel/update-site/R0.17.1/2019-12/更新2019/7/20https://download.eclipse.org/technology/babel/update-site/R0.17.0/2019-06/更新2019/5/22附:eclip…

    2022年4月6日
    35
  • 半小时实现Java手撸Http协议,爽!!(附完整源码,建议收藏)「建议收藏」

    半小时实现Java手撸Http协议,爽!!(附完整源码,建议收藏)「建议收藏」冰河就趁着周末,只用了几个Java类就简单的实现了Http协议,爽!!

    2022年8月22日
    7
  • 虚拟机桥接模式下设置静态IP地址无法上网

    虚拟机桥接模式下设置静态IP地址无法上网宿主机:win7虚拟机:Fedora24上网:无线路由器+ADSL虚拟机采用桥接模式,之前虚拟机的网卡配置为DHCP模式,通过无线路由器动态分配一个192.168.1.xxx的IP地址,可以上网。由于最近需要虚拟机的IP地址固定,就设置了一个镜头IP地址:192.168.1.30,结果发现虚拟机无法上网了。折腾了半天发现,在vmware的网络编辑器中,不要使用自动,要明确选择桥接到联网的

    2022年6月5日
    56
  • Android MD5加密

    Android MD5加密概述在网络中传输明文是一件非常危险的事情,所以通常将密码加密后传至服务器,由服务器保存密文在登录判定时只需比较密文是否相同即可。MD5加密是一种常用的加密算法,全称为“Message-DigestAlgorithm5”,即消息摘要算法,由MD2、MD3、MD4演变过来的,是一种单向加密算法,是一种不可逆的加密方式MD5优点:压缩性:任意长度的数据,算出的MD5值长度都是固定的。容易计算:从原数…

    2022年7月11日
    20
  • Mac搭建PHP环境[通俗易懂]

    Mac搭建PHP环境[通俗易懂]一、配置环境1启动APacheMac系统本身自带Apache,所以可以直接打开。以下为两种方式:打开“系统设置偏好(SystemPreferences)”->“共享(Sharing)”->“Web共享(WebSharing)”打开“终端(terminal)“,然后输入sudoapachectlstart,使Apache运行。开启Apache就是开启Web共享,这时输入“http://localhost”,就可以看到“Itworks!”的页面Apache默认根目

    2022年9月22日
    2
  • IDEA阅读spring源码并调试「建议收藏」

    IDEA阅读spring源码并调试「建议收藏」阿里云服务器优惠券领取优惠券目标:搭建起Spring源码阅读和代码调试跟踪的环境,顺便建立一个简单的Demo,能够调试Spring的源代码本节,主要介绍一下Spring源码阅读和调试的相关环境搭建,并使用MVN创建一个非常简单的Demo,以便可以跟踪和调试Spring的内核。1、源码的下载Spring的源码可以从GitHub上下载:https://github.com/spri………

    2022年8月12日
    9

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号