大数据建模流程之任务分析

大数据建模流程之任务分析上一篇文章我们简单阐述了,大多数研究者在进行大数据分析时,所存在的逻辑问题,并简明扼要的对大数据建模流程进行了说明,那么为了使大家更加清晰每一个步骤的具体内容,我们将每一个模块展开分析。详细阐述流程中具体要做的工作内容?一.宏观角度无论是大数据还是人工智能技术,其实都是需求或者项目主题的实现手段,商业上希望技术能够将产品向商品转化,或者对市场进行科学的分析,从而引导公司决策更符合市场需求;科研上希望技术能够进行多学课融合,使得科研结果更具有说服力,亦或者是技术本身的创新与变革,使得科技文明不断发展。由此

大家好,又见面了,我是你们的朋友全栈君。

上一篇文章我们简单阐述了,大多数研究者在进行大数据分析时,所存在的逻辑问题,并简明扼要的对大数据建模流程进行了说明,那么为了使大家更加清晰每一个步骤的具体内容,我们将每一个模块展开分析。详细阐述流程中具体要做的工作内容?
一.宏观角度
无论是大数据还是人工智能技术,其实都是需求或者项目主题的实现手段,商业上希望技术能够将产品向商品转化,或者对市场进行科学的分析,从而引导公司决策更符合市场需求;科研上希望技术能够进行多学课融合,使得科研结果更具有说服力,亦或者是技术本身的创新与变革,使得科技文明不断发展。由此看来,无论是商业界还是科研界,技术的核心作用是更为科学合理的解决实际问题。所以科研主题和业务需求是决定宏观方向和最终结果的地基。所以,需求的重要性决定了产品的价值。
下图清晰的阐述了目前流行的相关数据职业与需求的关系。
在这里插入图片描述
二.微观角度
当一个主题或者业务需求确定之后,我们需要做的第一个工作是尽可能的全面的去解析业务需求(主题),也就是大数据建模的第一步任务分析。Madge老师将从以下几个方面为大家一一说明:
1.准备工作
对于不同的主题或者业务需求所属的行业环境是不一样的,很多数据研究者是需要对业务所需要的环境有所了解的。但是,要是为了一次业务去学习一个行业这是不现实的,所以从以往文献中快速提取可用信息便是数据建模师必备的能力。除此之外,一个资深的数据建模师,有非常强的数据敏感度,当大量的数据出现在面前时候,凭借这种超强的数据敏感度和知识提取能力,是完全可以看出数据所呈现的就基本特征和可能的潜在关系。所以,资深的大数据建模师或者AI能够涉猎的领域非常广泛。
所以,当拿一个主题,首要的第一个任务就是通过各种方式了解行业背景,以及业务常识,方法有很多,如果具备我上述的能力的话,直接通过文献提取重要信息结合市场需求扩展即可。
2.任务分析
当行业背景或者主题的环境了解全面之后,就进入了最为重要的一步,就是任务分析,小编之前说过,任务分析越全面整体脉络也就越清晰,从而架构越完整,模型更容易搭建。那么任务分析对的内容是什么呢?我们用一张图说明。
在这里插入图片描述
根据上图我们能够观察到,任务分析大致分为了五个部分,至于第一部分任务描述,小编这里就不详细描述了。我们详细阐述一下:任务拆分,任务定类,确定任务环境。
为了能够更直观的反应各个步骤我们设立这样一个简单的项目场景,
例:已知过去20年某一个GDP,我们来预测未来五年该城市GDP的走向。
(当然,这里我们只是用这个例子做一步骤引导。切不可当成一个完整的项目去看。)
首先,我们知道这是一个研究一个城市经济发展状况的案例,所以要进行经济环境的基本描述,另外补充国民经济的相关常识,这些我们就不在赘述。
2.1任务拆分
当一个任务被指定或者一个主题被提出,我们不难发现他们所需要处理的问题并不只是一个。我们需要考虑该任务所包含的子问题的需要解决。当然,这就去取决于建模师对问题的认知和业务常识了,所以这一步份往往需要参考文献,或者同专业领域的专家进行合作。
例如:就研究GDP而言,就有可能存在以下子问题。
A.整体市场大环境的评估,属于稳定期,飞速发展时期,还是动荡时期等。
B.该城市的人口结构以及人口增长进行预测分析。
C.该城市的产业结构变动
D.该城市的GDP的变化
以上我们只是简单的罗列出几条,当然任务拆分由于角度不同会长产生很多子问题,有很多时候我们只选择我们需求的角度详细分析即可。但是,一定要能够说明单个子问题产生的原因。
例如,一个城市的GDP一定是受市场经济状况,社会是否稳定,或者是否出现不可抗因素等影响的。因此,对大环境的评估将是一个很重要的问题。当然有些时候我们也可以假定是稳定期,这取决于你自己的需求和所处的环境。
2.2任务定类
当子问题确定之后,对问题进行定类是十分重要的。定类主要考虑的是子问题的类别,是分类,回归,关联关系等?当然还要分析是有监督还是无监督?至于问题的类别,有时间我们会详细阐述。
例如:在上述例子中,我们的子问题对应的类别可以这样评定。
在这里插入图片描述
2.3 确定任务环境
确定任务环境主要是指数据环境。
第一:要先确定你所选择的子任务是作为假设还是具体的分析对象;
第二:确定你的数据集是文本,语音,图像还是数值;
第三:对单个子问题进行背景描述。
2.4 梳理逻辑
将以上任务分析总结一个逻辑框架,进行整理。

推荐大家关注公众号,有很多有意思的的知识,可免费领取学习资料哦
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/135828.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 服务器硬盘整体ghost,ghost备份整个硬盘| 全盘镜像ghost步骤[通俗易懂]

    服务器硬盘整体ghost,ghost备份整个硬盘| 全盘镜像ghost步骤[通俗易懂]ghost备份整个硬盘|全盘镜像ghost步骤优点:全盘完全100%对拷,包括原有操作系统也可使用。新硬盘对拷结束后,可直接插上电脑使用。消耗时间最短。困难:对于第一次操作Ghost对拷的新人来说,需要严格对照图片步骤教程。一旦操作失误,可能导致原有母盘数据不可逆转丢失。步骤一:打开“ToDisk”对拷选项(1)首选打开Ghost工具,进入界面后,选择“Local”→“Disk”→“ToD…

    2022年9月6日
    4
  • C Delegates 委托

    C Delegates 委托C Delegates 委托通常我们都是把数据作为参数传递给方法 inti int Parse 99 当需要把方法传送给其他方法时就需要使用委托 类的用法 首先声明一个类 接着实例化一个类 委托的用法和类的用法类似 首先定义委托告诉编译器这种类型的委托表示哪种类型的方法 接着创建该委托的一个或者多个实例 声明委托委托的类型安全性非常高 在定义委托时必须给出他所表示的方法的签名

    2025年9月4日
    0
  • DHCP协议 详解[通俗易懂]

    DHCP协议 详解[通俗易懂]原文地址:http://blog.csdn.net/windeal3203/article/details/50677166  DHCP:动态主机配置协议  TCP/IP协议想要运行正常的话,网络中的主机和路由器不可避免地需要配置一些信息(如接口的IP地址等)。有了这些配置信息主机/路由器才能提供/使用特定的网络服务。  主机信息的必要元素有:IP地址、子网掩码、DNS服务器IP地址

    2022年5月24日
    40
  • LabVIEW图像灰度分析与变换(基础篇—4)

    LabVIEW图像灰度分析与变换(基础篇—4)图像分析是将图像的像素灰度统计和测量技术结合,使机器可以理解图像内容,并提取特征信息以实现智能检测目的的学科。图像分析更侧重于对图像内容的分析、解释和识别。

    2022年6月16日
    57
  • 卡商卡盟在线批发平台_卡盟总控源码

    卡商卡盟在线批发平台_卡盟总控源码源码介绍:该源码对接宝塔API实现秒搭建主站功能,包括分站开通等都无需人工操作源码价值:****.**¥我也不知道值多少钱,反正修了很久才对接好宝塔接口跟各种问题,搞了好多天,时间长达3个月,不过不是连续修2个月,反正开始搞到现在搞了3个月多吧没有接好支付通道,想要运营的可以找我对接或者找别人对接安装说明服务器系统:Linux+Centos7.x+宝塔亲测环境:Nginx1.1…

    2022年8月12日
    4
  • 【C++学习五】STL库的应用

    【C++学习五】STL库的应用文章目录初识C++之STL标准库1.C++STL的三大核心组件2.自定义函数与算法对容器实现操作3.基于自定义函数以及操作模板实现简易数字图像处理3.1图像灰度变换3.2图像二值化4.初识STL容器之:set集合5.初识STL容器之:map(关联容器)结语初识C++之STL标准库STL是StandardTemplateLibrary的缩写,中文译为“标准模板库”。STL是C++标准库的一部分。我们之前已经基本了解了C++中的模板templet,以及模板的作用。可以说,C

    2022年10月15日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号