工业大数据为何落地难

工业大数据为何落地难

眼前的困难和问题,很可能是过去没有准备的结果;而现在的失败,往往是过去草率行事的结果。同样,工业大数据浪潮来了,却会发现积累了多年的数据没法用。我总结了一下,大体有三种原因:

1、数据对应不上

围绕同一个对象或过程的数据都有记录,但串不起来。比如,一个产品是某设备生产的。产品信息却无法与设备生产的时间对上。

2、数据结构杂乱

围绕特定事件或产品的信息很多,但数据没有被结构化地组织起来,想找的时候却找不到。

3、错用分析方法

许多传统分析方法其实非常有效,如方差分析、回归分析、决策树。很多人知道这些方法,却只会生搬硬套。硬套不行就责怪方法不行,转而去找些时髦的方法。

 

前两个问题根源是收集数据时指导思想的浮躁:只要把数据都收集上来就行了,以为数据“全”了就能用。第三个问题的根源则在于对学问的浮躁:很多人以为自己懂了,用不好就怪基本方法。另外,学术界为了发文章,过度推崇新方法也是导致浮躁的重要诱因。

 

由此观之,从事分析工作之前,应复习一下小学老师的教诲:戒骄戒躁。

 

原文:http://blog.sina.com.cn/s/blog_4c0184bb0102vhiv.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/119555.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • ubuntu14.04 安装pycharm

    ubuntu14.04 安装pycharm参考链接:http://itsfoss.com/install-pycharm-ubuntu/怎样在ubuntu14.04上安装pycharmpycharm是一款为python开发而生的IDE。它已经被专家认为是最好的pythonIDE之一。pycharm有社区版和专业版两种。社区版是免费的。但是专业版有更多的功能。我在下面的教程中展示如何安装这两种pycharm。…

    2022年8月25日
    5
  • 实验十(课程资源)-DNS服务器配置与管理[通俗易懂]

    实验十(课程资源)-DNS服务器配置与管理[通俗易懂]课程实验报告:一、实验目的:1、了解DNS工作原理及域名解析过程2、掌握DNS服务器的安装、配置与管理二、实验目的:在windows2003上搭建DNS服务器,并进行相关配置与功能测试三、实验原理:DNS:是域名系统(DomainNameSystem)的缩写,指在Internet中使用的分配名字和地址的机制。域名系统允许用户使用友好的名字而不是难以记忆的数字——IP

    2022年6月3日
    43
  • pytorch的安装及其在pycharm中的使用「建议收藏」

    pytorch的安装及其在pycharm中的使用「建议收藏」1.首先配置Anaconda虚拟环境在AnacondaPrompt中输入condacreate-npytorchpython==3.72.在该环境中安装pytorch因为前面已经安装了cuda10.0.130和cudnn,安装与之匹配的pytorch版本,官网中寻找,但是官网的貌似不太对,最后看的是这个回答pipinstalltorch==1.2.0torchvision==0.4.0-fhttps://download.pytorch.org/whl/torch_stab

    2022年8月25日
    4
  • vscode怎么快速生成html模板_vscode怎样新建HTML文件

    vscode怎么快速生成html模板_vscode怎样新建HTML文件1、直接在空白的html文件中,输入英文感叹号!2、点击回车键或者tab键,即可生成html模板

    2022年8月21日
    5
  • 二叉树的一些性质图解

    二叉树的一些性质图解树的介绍1.树的定义树是一种数据结构,它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:(01)每个节点有零个或多个子节点;(02)没有父节点的节点称为根节点;(03)每一个非根节点有且只有一个父节点;(04)除了根节点外,每个子节点可以分为多个不相交的子树。 2.树的基本术语若…

    2022年5月20日
    34
  • Hadoop生态圈hive应用

    Hadoop生态圈hive应用第1章Hive基本概念1.1什么是HiveHive:由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。1.2Hive的优缺点1.2.1优点1)操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)。2)避免了去写MapReduce,减少开发人员的学习成本。3)Hive的执行延迟比较高,因此Hive常用于数

    2022年5月11日
    42

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号