《深入浅出Python机器学习》读书笔记 第一章 概述

《深入浅出Python机器学习》读书笔记 第一章 概述《深入浅出Python机器学习》读书笔记,第一章概述

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺


前言

《深入浅出Python机器学习》读书笔记,第一章概述


提示:以下是本篇文章正文内容

一、什么是机器学习

本意是指一种让计算机不经过明显编程的情况下,对数据进行学习,并且做出预测的方法,数据计算机科学领域的一个子集。

二、机器学习的一些应用场景

  1. 智能推荐。例如淘宝的商品推荐,网易云音乐的歌曲推荐
  2. 社交网络中的效果广告。给用户推送合适的广告
  3. 互联网金融中的风控系统。根据过往数据,判断当前订单是否
    是欺诈订单
  4. 新闻资讯中的内容审查。判断新闻是否是虚假新闻,或者内容
    是否违反国家 法律
  5. 其他领域。如医疗中根据病史症状和化验结果找到病因;
    智能物流、智能家居、无人驾驶等领域。
  6. AlphaGo

三、学习机器学习的过程

  1. 掌握一门语言
  2. 学习机器学习的基本概念
  3. 了解常见的算法
  4. 掌握数据处理的技巧
  5. 优化模型
  6. 动手

四、有监督学习和无监督学习

  1. 有监督学习是通过现有数据集进行建模,再用模型对新的数据样本进行分类或者回归分析的机器学习方法。有监督学习中,训练数据集一般包含样本特征变量及分类标签,机器学习使用不同的算法通过这些数据推断出分类的方法,并用在新的样本中。

  2. 无监督学习是在没有训练数据集的情况下,对没有标签的数据分析并建立合适的模型,一遍给出解决方案的方法。在无监督学习中,场景的两种任务类型是数据转换和聚类分析。数据转换的目的是把复杂数据通过非监督算法进行简化。常见的转换方法是数据降维:通过对数据集进行分析,将无关紧要的维度去除,保留关键特征。聚类是把相似特征的数据分到不同的组。

五、分类和回归

  1. 分类是对样本的类标签进行预测,判断样本属于哪个类别。通常分类是离散
    的数值。

  2. 回归分析是要预测一个连续的数值或范围。

六、模型的泛化、过拟合与欠拟合

  1. 模型的泛化是指模型用来预测新数据时的好坏,如果对新数据预测依然准
    确,说明泛化的准确度较好。

  2. 过拟合是指拟合训练数据集时拟合很好,拟合测试数据集市很差的情况

  3. 欠拟合指模型连训练数据集都拟合不好,测试数据集也很差的情况

下一篇:基于Python语言的环境配置

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/183486.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • ora-01006:绑定变量不存在_输出参数不是绑定变量

    ora-01006:绑定变量不存在_输出参数不是绑定变量  #命令行新建job错误:ORA-01008并非所有变量都已绑定。 1、改正前代码:DECLAREjobNUMBER;begin      sys.dbms_job.submit(job=>:job, what=>’P_AUTO_FETCH_RECORDS;’, next_date=>to_…

    2025年9月25日
    4
  • gpl和lgpl区别_nh拿下pgc开门红

    gpl和lgpl区别_nh拿下pgc开门红GPL我们很熟悉的Linux就是采用了GPL。GPL协议和BSD,ApacheLicence等鼓励代码重用的许可很不一样。GPL的出发点是代码的开源/免费使用和引用/修改/衍生代码的开源/免费使用,但不允许修改后和衍生的代码做为闭源的商业软件发布和销售。这也就是为什么我们能用免费的各种linux,包括商业公司的linux和linux上各种各样的由个人,组织,以及商业软件公司开

    2025年6月6日
    4
  • Aria2使用详细教程「建议收藏」

    Aria2使用详细教程「建议收藏」随着百度网盘限速,迅雷限速,逼着用户花钱充会员,越来越多的激活成功教程方法和替代工具出现,Aria2就是这样一种工具,Aria2的简介就不赘述了,网上多的是。

    2022年6月30日
    48
  • spring源码分析-spring与tomcat整合原理

    spring源码分析-spring与tomcat整合原理

    2021年8月4日
    55
  • Anaconda–Pycharm安装教程[通俗易懂]

    Anaconda–Pycharm安装教程[通俗易懂]因为不想每次下载安装的时候都要去找博客,干脆就参考别人的博客,把自己需要的写下来了。1、Anaconda的安装从官网https://www.anaconda.com/download/下载Anaconda的安装程序,在该页面选择你电脑所对应的系统(Windows、macOSorLinux)以及操作系统位数(64位or32位)。选择Python3.8,等待下载完成,之后便会得到一个anaconda的exe可执行文件。![在这里插入图片描述](https://img-blog.csd

    2022年8月28日
    3
  • R语言基本画图「建议收藏」

    R语言创建多个图形方法一:每次创建一副新图形之前打开一个新的图形窗口dev.new()画图dev.new()画图……方法二:通过图形用户界面。windows上,打开一个一个图形界面,勾选“历史”——“记录”。然后点击菜单中的“上(下)一个”即可。方法三:使用函数dev.new()、dev.next()、dev.prev()、dev.set()

    2022年4月13日
    327

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号