Java读取pkl文件_theano csv到pkl文件

Java读取pkl文件_theano csv到pkl文件我正在尝试将一个pkl文件从csv起点加载到theano中importnumpyasnpimportcsvimportgzip,cPicklefromnumpyimportgenfromtxtimporttheanoimporttheano.tensorasT#OpencsvfileandreadindatacsvFile=”filename.csv”my…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

我正在尝试将一个pkl文件从csv起点加载到theano中

import numpy as np

import csv

import gzip, cPickle

from numpy import genfromtxt

import theano

import theano.tensor as T

#Open csv file and read in data

csvFile = “filename.csv”

my_data = genfromtxt(csvFile, delimiter=’,’, skip_header=1)

data_shape = “There are ” + repr(my_data.shape[0]) + ” samples of vector length ” + repr(my_data.shape[1])

num_rows = my_data.shape[0] # Number of data samples

num_cols = my_data.shape[1] # Length of Data Vector

total_size = (num_cols-1) * num_rows

data = np.arange(total_size)

data = data.reshape(num_rows, num_cols-1) # 2D Matrix of data points

data = data.astype(‘float32’)

label = np.arange(num_rows)

print label.shape

#label = label.reshape(num_rows, 1) # 2D Matrix of data points

label = label.astype(‘float32’)

print data.shape

#Read through data file, assume label is in last col

for i in range(my_data.shape[0]):

label[i] = my_data[i][num_cols-1]

for j in range(num_cols-1):

data[i][j] = my_data[i][j]

#Split data in terms of 70% train, 10% val, 20% test

train_num = int(num_rows * 0.7)

val_num = int(num_rows * 0.1)

test_num = int(num_rows * 0.2)

DataSetState = “This dataset has ” + repr(data.shape[0]) + ” samples of length ” + repr(data.shape[1]) + “. The number of training examples is ” + repr(train_num)

print DataSetState

train_set_x = data[:train_num]

train_set_y = label[:train_num]

val_set_x = data[train_num+1:train_num+val_num]

val_set_y = label[train_num+1:train_num+val_num]

test_set_x = data[train_num+val_num+1:]

test_set_y = label[train_num+val_num+1:]

# Divided dataset into 3 parts. split by percentage.

train_set = train_set_x, train_set_y

val_set = val_set_x, val_set_y

test_set = test_set_x, val_set_y

dataset = [train_set, val_set, test_set]

f = gzip.open(csvFile+’.pkl.gz’,’wb’)

cPickle.dump(dataset, f, protocol=2)

f.close()

当我通过Thenao(作为DBN或SdA)运行生成的pkl文件时,它预先训练得很好,这让我觉得数据存储正确 .

但是,当涉及到微调时,我收到以下错误:

epoch 1, minibatch 2775/2775, validation error 0.000000 %

Traceback (most recent call last):

File “SdA_custom.py”, line 489, in

test_SdA()

File “SdA_custom.py”, line 463, in test_SdA

test_losses = test_model()

File “SdA_custom.py”, line 321, in test_score

return [test_score_i(i) for i in xrange(n_test_batches)]

File “/usr/local/lib/python2.7/dist-packages/theano/compile/function_module.py”, line 606, in __call__

storage_map=self.fn.storage_map)

File “/usr/local/lib/python2.7/dist-packages/theano/compile/function_module.py”, line 595, in __call__

outputs = self.fn()

ValueError: Input dimension mis-match. (input[0].shape[0] = 10, input[1].shape[0] = 3)

Apply node that caused the error: Elemwise{neq,no_inplace}(argmax, Subtensor{int64:int64:}.0)

Inputs types: [TensorType(int64, vector), TensorType(int32, vector)]

Inputs shapes: [(10,), (3,)]

Inputs strides: [(8,), (4,)]

Inputs values: [‘not shown’, array([0, 0, 0], dtype=int32)]

Backtrace when the node is created:

File “/home/dean/Documents/DeepLearningRepo/DeepLearningTutorials-master/code/logistic_sgd.py”, line 164, in errors

return T.mean(T.neq(self.y_pred, y))

HINT: Use the Theano flag ‘exception_verbosity=high’ for a debugprint and storage map footprint of this apply node.

10是我的批次的大小,如果我改为批量大小为1,我得到以下内容:

ValueError: Input dimension mis-match. (input[0].shape[0] = 1, input[1].shape[0] = 0)

我认为我在制作pkl时错误地存储了标签,但我似乎无法发现正在发生的事情或为什么更改批处理会改变错误

希望你能帮忙!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/195494.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • a4如何打印双面小册子需要排页码吗_a4纸如何打印四版的小册子

    a4如何打印双面小册子需要排页码吗_a4纸如何打印四版的小册子我来告诉你!!你手上这种册子的装订方式是骑马订!这种装订方式在adobepdf里面用拼版插件拼版非常快,不过非专业人士都不会用!有的打印机的打印驱动页面里面也有小册子打印的方式,可以直接打印出来!重点来了,以上的方法你都用不了的话,就只能用最费事的方法了!在word或者wps里面一张一张的排!1.页面数,骑马订册子的页面数必须是4的倍数,不够的话就得加空白页,空白页最好加在封二或者封三(封面…

    2022年9月6日
    5
  • MySQL默认隔离级别是RR,但是为什么一些大厂会改成RC?

    MySQL默认隔离级别是RR,但是为什么一些大厂会改成RC?为什么默认隔离级别是RR?可能大部分人都只知道MySQL的隔离级别有4个,分别是RU读未提交、RC读已提交、RR可重复读和Serializable可串行化,很少有人知道MySQL默认的隔离级别是RR,Oracle默认的隔离级别是RC。那就更少有人知道为什么MySQL默认的隔离级别是RR了。我也是刚刚工作之余看到了一篇文章,里面简单提了一下这个问题,我就四处找寻了一下答案,将自己所理解的记录下来,希望对大家有帮助。理解脏读、不可重复读、幻读脏读:某个事务对一份数据执行了更新操作,另一个事务在此时读

    2025年8月31日
    8
  • Java常见Exception物种

    Java常见Exception物种

    2022年1月11日
    46
  • 最详细AMD Ryzen CPU,VMware 15安装macOS 10.15.x Catalina 记录(第一篇)[通俗易懂]

    最详细AMD Ryzen CPU,VMware 15安装macOS 10.15.x Catalina 记录(第一篇)[通俗易懂]如何在非macOS电脑上体验macOS,目前我所知道的有两种方式:真机安装(难度大,本文介绍,感兴趣的童鞋可以自行搜索);虚拟机安装。不管是真机安装还是虚拟机安装,Intel的cpu在安装过程中遇到的坑相比AMD的cpu要少很多。所以本文不介绍如何在Intelcpu的pc上安装macOS,网上教程很多,读者可自行搜索。很多AMDcpu的朋友,在用虚拟机安装macOS的过程中,肯定遇到过一些问题,并且有些问题很棘手,会被困扰几天,那么本文将介绍如何在AMDcpu的电脑上安装mac

    2022年5月13日
    56
  • 广义表中关于tail和head的计算

    广义表中关于tail和head的计算根据表头、表尾的定义可知:任何一个非空广义表的表头是表中第一个元素,它可以是原子,也可以是子表,而其表尾必定是子表。也就是说,广义表的head操作,取出的元素是什么,那么结果就是什么。但是tail操作取出的元素外必须加一个表——“ ()“举一个简单的列子:已知广义表LS=((a,b,c),(d,e,f)),如果需要取出这个e这个元素,那么使用tail和head如何将这个取出来。利用上面说的,tai…

    2022年5月4日
    106
  • Android之Http通信——3.Android HTTP请求方式:HttpURLConnection

    Android之Http通信——3.Android HTTP请求方式:HttpURLConnection

    2022年1月19日
    68

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号