CNN做序列标注问题(tensorflow)

CNN做序列标注问题(tensorflow)

一、搭建简单的CNN做序列标注代码

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
    
  
TIME_STEPS = 15# backpropagation through time 的time_steps
BATCH_SIZE = 1#50
INPUT_SIZE = 1 # x数据输入size
LR = 0.05  # learning rate
num_tags = 2 
# 定义一个生成数据的 get_batch function:
def get_batch():
    xs = np.array([[[[2], [3], [4], [5], [5], [5], [1], [5], [3], [2], [5], [5], [5], [3], [5]]]])
    res = np.array([[0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 0, 1]])
    ys = np.zeros([1,TIME_STEPS,2])
    for i in range(TIME_STEPS):
        if(res[0,i] == 0):
            ys[0,i,0] = 1
            ys[0,i,1] = 0
        else:
            ys[0,i,0] = 0
            ys[0,i,1] = 1
        
    return [xs, res,ys]
    
# 定义 CNN 的主体结构
class CNN(object):
    def __init__(self, n_steps, input_size, num_tags, batch_size):
        self.n_steps = n_steps
        self.input_size = input_size
        self.num_tags = num_tags
        self.batch_size = batch_size
        #卷积神将网络的输入:[batch, in_height, in_width, in_channels],在自然语言处理中height为1
        self.xs = tf.placeholder(tf.float32, [self.batch_size,1, self.n_steps, self.input_size], name='xs')
        #做序列标注,第二维对应好输入的n_steps,相当于每个时刻的输入都有一个输出
        self.ys = tf.placeholder(tf.int32, [self.batch_size, self.n_steps,self.num_tags], name='ys')#
        
        self.featureNum = 10#提取10个特征
        
        #[卷积核的高度,卷积核的宽度,图像通道数,卷积核个数]
        W_conv1 = self.weight_variable([1,3,1,self.featureNum])#提取10个特征
        #对应10个卷积核输出
        b_conv1 = self.bias_varibale([self.featureNum]) 
    
        #卷积操作
        layer_conv1  = tf.nn.conv2d(self.xs, W_conv1,strides=[1, 1, 1, 1],padding="SAME",) + b_conv1
        #激励层
        layer_conv1  = tf.nn.relu(layer_conv1)
        #最大值池化  本处去除池化层为了后续计算简便
        #layer_pool1  = tf.nn.max_pool(layer_conv1,
        #                              [1, 1, 3, 1],[1,1,1,1],padding='VALID') 
        layer_pool1 = layer_conv1

        # 全连接层  映射到self.n_steps x self.num_tags
        layer_pool1 = tf.reshape(layer_pool1,[self.n_steps,self.featureNum])
        W_fc1  = self.weight_variable([self.featureNum,self.num_tags])
        b_fc1  = self.bias_varibale([self.num_tags])
        h_fc1  = tf.matmul(layer_pool1, W_fc1) + b_fc1
        #激励层
        h_fc1 = tf.nn.relu(h_fc1)
        #softmax 归一化
        self.y_conv = tf.nn.softmax(h_fc1)        
        self.label = tf.reshape(self.ys,[self.n_steps,2])
        self.cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=self.label, logits=self.y_conv))
        #梯度下降
        self.train_op = tf.train.AdamOptimizer(LR).minimize(self.cost)      
        self.pred = tf.argmax(self.y_conv,axis = 1)
       
    def weight_variable(self,shape):
        initial=tf.truncated_normal(shape, mean=0.0, stddev=0.1)
        return tf.Variable(initial)
    def bias_varibale(self,shape):
        initial=tf.constant(0,1,shape=shape)
        return tf.Variable(initial)   
    
# 训练CNN
if __name__ == '__main__':
       
    # 搭建 CNN 模型
    model = CNN(TIME_STEPS, INPUT_SIZE, num_tags, BATCH_SIZE)
    sess = tf.Session()
    sess.run(tf.global_variables_initializer())
      
    # matplotlib可视化
    plt.ion()  # 设置连续 plot
    plt.show()  
    # 训练多次
    for i in range(150):
        xs, res,ys = get_batch()  # 提取 batch data
        # 初始化 data
        feed_dict = {
            model.xs: xs,
            model.ys: ys,
        }        
        # 训练
        _, cost,pred = sess.run(
            [model.train_op, model.cost,  model.pred],
            feed_dict=feed_dict)

    
        # plotting
  
        x = xs.reshape(-1,1)
        r = res.reshape(-1, 1)
        p = pred.reshape(-1, 1)
          
        x = range(len(x))
          
        plt.clf()
        plt.plot(x, r, 'r', x, p, 'b--')
        plt.ylim((-1.2, 1.2))
        plt.draw()
        plt.pause(0.3)  # 每 0.3 s 刷新一次
          
        # 打印 cost 结果
        if i % 20 == 0:
            print('cost: ', round(cost, 4))

  得到结果:

<span>CNN做序列标注问题(tensorflow)</span>

 

二、CNN主要知识点

  待整理。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/119442.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • docker 运行tomcat_docker和tomcat区别

    docker 运行tomcat_docker和tomcat区别在学习狂神的docker内容网络学习这一步的时候,按照步骤启动tomcat镜像,但是执行ipaddr之后发现下面问题,经过分析这说明我们下载的Tomcat镜像是精简版的,利用这个镜像去打开一个容器的时候发现没有ipaddr这个命令。所以到导致我们上述报错。上图执行的命令敲错了,重新执行aptinstall-yiproute2…

    2022年7月27日
    13
  • Android短信验证码控件,Android中实现短信验证码自动填入

    Android短信验证码控件,Android中实现短信验证码自动填入Android中实现短信验证码自动填入由于目前的好多应用都有短信验证,短信验证码收到后,用户手动输入已经显得有麻烦,于是我写了这篇博文,希望能对大家有所帮助。实现步骤:1.写一个SmsBroadcastReceiver,在AndroidMainifirst.xml文件中注册:/***配置广播接收者:**表示:*设置此广播接收者的级别为最高*/类代码:publiccl…

    2022年7月25日
    11
  • Matlabinf_matlab怎么定义函数

    Matlabinf_matlab怎么定义函数函数功能在图像处理中,该函数用于获取一张图片的具体信息。这些具体信息包括图片的格式、尺寸、颜色数量、修改时间等等。在matlab的命令窗口中键入docimfinfo或者helpimfinfo都可以得到该函数的帮助信息。调用方式info=imfinfo(filename,fmt)info=imfinfo(filename)程序示例  下面这个程序用于获取位图相关信息。该函数获取位图文件头信…

    2022年10月5日
    3
  • 共享打印机错误代码709_连接共享打印机错误0*0000011b

    共享打印机错误代码709_连接共享打印机错误0*0000011b最近发现很多用户连接或安装局域网共享的打印机时出现很多问题,常见的错误代码是0x0000011b和0x00000709或0x000006d9这三个错误。要如何解决呢?下面来讲一下如何解决这两个问题。键盘组合键徽标键Win+R键打开运行,在弹出的运行框中输入【services.msc】确定打开服务窗口,检查这两个服务是否已启动:PrintSpooler和WindowsFirewall一般Win7易出的错误6d9是后面的服务未启动所致。依次查找并卸载KB5005565、KB5005566、KB5005…

    2025年10月20日
    5
  • 最全Mac系统快捷键一览

    最全Mac系统快捷键一览Mac中主要有四个修饰键,分别是Command,Control,Option和Shift。这四个键分别有自己的图案,他们经常出现在Mac应用程序中的菜单栏里,方便你随时学习新的快捷键。MAC键盘快捷键符号图例通用Command是Mac里最重要的修饰键,在大多数情况下相当于Windows下的Ctrl。所以以下最基本操作很好理解:Command+Z 撤销Comma

    2022年5月25日
    27
  • 代码保护– 几款加壳工具

    代码保护– 几款加壳工具VirboxProtector(商用)分带授权的版本和独立壳。带授权的版本加壳后需要绑定许可,许可控制软件能否用,加壳保护安全。独立版的话就只是对代码做加壳,防止代码反编译。碎片代码执行、外壳加密、混淆、数据加密。服务商提供了较为完善的文档以及加密方式,提供了较为充分的产品管理平台,以及云端网络加密,并且对于开发者免费使用。使用评价:简单下载使用了一下,提供的功能很多,并且管…

    2022年6月27日
    51

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号