5分钟搞定敏感词过滤!

5分钟搞定敏感词过滤! 函数工作流(FunctionGraph,FGS)是一项基于事件驱动的函数托管计算服务,托管函数具备以毫秒级弹性伸缩、免运维、高可靠的方式运行。通过函数工作流,开发者无需配置和管理服务器,只需关注业务逻辑,编写函数代码,以无服务器的方式构建应用,便能开发出一个弹性高可用的后端系统,并按实际运行消耗的资源计费。极大地提高了开发和运维效率,减小了运作成本。 相比于传统的架构,函数服务构建的…

大家好,又见面了,我是你们的朋友全栈君。

 

函数工作流(FunctionGraph,FGS)是一项基于事件驱动的函数托管计算服务,托管函数具备以毫秒级弹性伸缩、免运维、高可靠的方式运行。通过函数工作流,开发者无需配置和管理服务器,只需关注业务逻辑,编写函数代码,以无服务器的方式构建应用,便能开发出一个弹性高可用的后端系统,并按实际运行消耗的资源计费。极大地提高了开发和运维效率,减小了运作成本。

 

相比于传统的架构,函数服务构建的无服务器架构具有如下优点:

1. 无需关注任何服务器,只需关注核心业务逻辑,提高开发和运维效率;

2. 函数运行随业务量弹性伸缩,按需付费,执行才计费,对于访问量波峰波谷非常明显的场景可以减少大量成本;

3. 通过简单的配置即可连通函数工作流和其它各云服务,通过事件触发函数,灵活易扩展;

 

为了进一步让大家感受函数工作流的优势,我们将介绍如何通过云函数快速构建一个无服务器的敏感词过滤系统,本文我们主要关注后端系统,前端的表现形式很多,大家可以自行构建。如下图,该系统会识别用户上传的文本内容是否包含敏感信息(如色情、政治等),并对这些词语进行过滤。

5分钟搞定敏感词过滤!

试想,如果我们通过传统的模式开发此应用,需要如何开发?

 

即使是基于现在的云平台,我们也仍需要购买云服务器,关注其规格、镜像、网络等各指标的选型和运维,然后在开发过程中可能还需要考虑与其他云服务的集成使用问题,使代码中耦合大量非业务代码,并且服务器等资源也并非是按需的,特别是对于访问量波峰波谷非常明显的场景,会造成大量多余的费用。

 

现在我们可以通过函数工作流服务来快速构建这个系统,并且完全无需关注服务器,且弹性伸缩运行、按需计费,如图:

http://functionstage-tutorial.obs-website.cn-north-1.myhwclouds.com/assets/images/ai.png

创建函数,在函数中调用华为云内容检测服务提供的文本检测接口,实现文本的敏感词检测,并为该函数配置一个APIG触发器,对外提供敏感词过滤的API,从而构建出一个完整的敏感词过滤的无服务器系统。客户端调用API,他会自动触发函数执行,而开发者编写的函数只需实现接收到文本之后如何处理文本的逻辑(调用内容检测服务服务)即可,最后将结果返回给客户端。至此,我们就构建了一个完整的无服务器敏感词过滤系统。

 

现在,我们将介绍如何端到端地将此无服务器系统构建出来。

1. 准备工作

进入华为云内容检测服务,申请开通文本内容检测,成功申请后边可以调用内容检测服务提供的文本检测接口了。

 

2. 创建函数

进入函数工作流服务页面,创建函数,实现文本检测的接口调用和敏感词过滤,代码如下(Python):

# -*- coding:utf-8 -*-

import json

import base64

import urllib

import urllib2

import ssl

import sys

 

reload(sys)

sys.setdefaultencoding(‘utf-8’)

 

def do_filter(msg,str_list):

    result = ”

    try:

        if len(str_list) <=0:

            return msg

        for str in str_list:

            str_tmp = msg.replace(str,”)

            msg = str_tmp

        result = msg

    except:

        print(“_do_filter catch an exception!”)

    return result

 

def filter(context, msg):

    result = ”

    try:

        ssl._create_default_https_context = ssl._create_unverified_context

       

        token = context.getToken();

        headers = {‘Content-Type’:’application/json;charset=utf8′,’X-Auth-Token’:token}

       

        url = “https://ais.cn-north-1.myhwclouds.com/v1.0/moderation/text”

       

        values = {}

        values[‘categories’] = [‘porn’,’ad’,’politics’,’abuse’,’contraband’]

        #msg = base64.b64encode(msg)

        item = {‘type’:’content’,’text’:msg}

        values[‘items’] = [item]

       

        data = json.dumps(values)

        print(“data: %s”%data)

       

        request = urllib2.Request(url,data,headers)

        rsp = urllib2.urlopen(request)

        http_rsp = rsp.read()

        print(“http response: %s” %http_rsp)

       

        json_rsp = json.loads(http_rsp)

        result = json_rsp[‘result’]

       

        suggestion = result[‘suggestion’]

        

        if suggestion == ‘pass’:

            print(“input msg have passed the checking!”)

            result = msg

        else:

            detail = result[‘detail’]

       

            if detail.has_key(‘porn’):

                list_porn = detail[‘porn’]

                msg = do_filter(msg,list_porn)

            if detail.has_key(‘ad’):

                list_ad = detail[‘ad’]

                msg = do_filter(msg,list_ad)

            if detail.has_key(‘politics’):

                list_politics = detail[‘politics’]

                msg = do_filter(msg,list_politics)

            if detail.has_key(‘abuse’):

                list_abuse = detail[‘abuse’]

                msg = do_filter(msg,list_abuse)

            if detail.has_key(‘contraband’):

                list_contraband = detail[‘contraband’]

                msg = do_filter(msg,list_contraband)

            result = msg

    except Exception, e:

        print e

        print(“filter catch an exception!”)

    return result

 

def handler (event, context):

    print(“message filter begin!”)

    result = “”

    response = {}

    http_method = event.get(‘httpMethod’)

   

    if http_method == ‘OPTIONS’:

        response = {

            ‘statusCode’: 200,

            ‘isBase64Encoded’: True,

            ‘headers’: {

                “Content-Type”: “application/json; charset=utf-8”,

                “Access-Control-Allow-Origin”: “*”,

                “Access-Control-Allow-Headers”: “Content-Type,Accept”,

                “Access-Control-Allow-Methods”: “GET,POST,PUT,DELETE”

            },

            ‘body’: base64.b64encode(‘{“result”:’+ ‘”‘ + result +'”}’),

        }

        return response

    body = event.get(‘body’)

    body_decode = base64.b64decode(body)

    json_object = json.loads(body_decode)

    msg = json_object[‘msg’]

   

    print(‘msg : %s’%msg)

   

    try:

        result = filter(context, msg)

        response = {

            ‘statusCode’: 200,

            ‘isBase64Encoded’: True,

            ‘headers’: {

                “Content-Type”: “application/json; charset=utf-8”,

                “Access-Control-Allow-Origin”: “*”,

                “Access-Control-Allow-Headers”: “Content-Type,Accept”,

                “Access-Control-Allow-Methods”: “GET,POST,PUT,DELETE”

            },

            ‘body’: base64.b64encode(‘{“result”:’+ ‘”‘ + result +'”}’),

        }

    except:

        print(“function catch an exception!”)

   

    return response

   

函数创建完成之后,为其配置具有IAM访问权限的委托,因为本函数代码中获取用户的ak、sk需要拥有访问IAM的权限。

 

3. 创建APIG触发器

为函数配置一个APIG触发器,这样便得到一个调用该函数的HTTP(S) API,供外部调用。

 

4. 测试

使用postman等工具向上一步中创建的APIG触发器的接口发送post请求,body体为:{
“msg”: 过滤检测的文本},查看返回信息。

比如发送 {“msg”: “just fuck …”}, 返回体为 {“result”: “just  …”}

 

自此,我们就完整地实现了一个无服务器的敏感词过滤后端系统。

欢迎体验!

https://www.huaweicloud.com/product/functiongraph.html?utm_source= zjqd&utm_medium=mediafree&utm_campaign=functiongraph&utm_content=article-0727-1

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/131468.html原文链接:https://javaforall.net

(0)
上一篇 2022年4月29日 下午9:00
下一篇 2022年4月29日 下午9:00


相关推荐

  • Claude Code 简明使用指南

    Claude Code 简明使用指南

    2026年3月16日
    3
  • MySQL 游标

    MySQL 游标我们之前写的 sql 语句 虽然可以通过筛选条件来限定返回的记录 但是我们却没有办法在结果集里面 像指针一样 定位每一条记录 向前定位 向后定位 或随意定位到某一条记录 为了解决这个问题 我们可以使用游标 游标可以让我们可以对结果集中的每一条记录进行定位 并对指向的记录中的数据进行操作接下来就让我们来看看具体怎么使用 这里的 select 语句用来返回一个创建游标的结果集 cursor 英文意思是游标 光标简单记忆就是说用一个查询语句来描述游标举例 2 2 打开游标定义好游标后 如果想要使用它 就得

    2025年10月17日
    7
  • 分布式架构概述及设计

    分布式架构概述及设计引言随着越来越多的人参与到互联网的浪潮来 曾经的单体应用架构越来越无法满足需求 所以 分布式集群架构出现 也因此 分布式搭建开发成为了 Web 开发者必掌握的技能之一 那什么是分布式呢 怎么实现分布式以及怎么处理分布式带来的问题呢 本系列文章是笔者对自身学习的总结 包含但不限于 Zookeeper Dubbo 消息队列 ActiveMQ Kafka RabbitMQ Nosql Redis Mong

    2026年3月17日
    1
  • 渗透工具-OWASP ZAP

    渗透工具-OWASP ZAPOWASPZed 攻击代理 ZAP 是世界上最受欢迎的免费安全审计工具之一 由数百名国际志愿者 积极维护 它可以帮助您在开发和测试应用程序时自动查找 Web 应用程序中的安全漏洞 也可以说 ZAP 是一个中间人代理 它允许您查看您对 Web 应用程序发出的所有请求以及您从中收到的所有响应 即可以用于安全专家 开发人员 功能测试人员 甚至是渗透测试入门人员 它也是经验丰富的测试人员用于手动安全测试的绝佳工具 主要拥有以下重要功能 本地代理主动扫描被动扫描 Fuzzy 暴力激活成功教程一 OWASPZ

    2026年3月16日
    2
  • 解决Deepin下qq无法显示图片「建议收藏」

    解决Deepin下qq无法显示图片「建议收藏」添加内核参数彻底禁用IPv6:执行:sudodedit/etc/default/grub开始编辑文件:在此行添加参数:GRUB_CMDLINE_LINUX=”ipv6.disable=1″保存退出后执行:sudoupdate-grub执行完命令之后,重新启动系统。亲测:可以接收图片…

    2022年8月10日
    10
  • 面向对象程序设计的基本原理_面向对象程序设计c++答案

    面向对象程序设计的基本原理_面向对象程序设计c++答案Java程序设计(面向对象)- 设计原理

    2022年4月22日
    34

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号