Pandas merge函数「建议收藏」

Pandas merge函数「建议收藏」[toc]函数原型pd.merge(left,right,how=’inner’,on=None,left_on=None,right_on=None,left_index=False,right_index=False,sort=True,suffixes=(‘_x’,’_y’),copy=True,indicator=False,validate=None)参数left:拼接的左侧DataFrame对象r.

大家好,又见面了,我是你们的朋友全栈君。

	[toc]

函数原型

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,
         left_index=False, right_index=False, sort=True,
         suffixes=('_x', '_y'), copy=True, indicator=False,
         validate=None)

参数

  • left: 拼接的左侧DataFrame对象
  • right: 拼接的右侧DataFrame对象
  • on: 要加入的列或索引级别名称。 必须在左侧和右侧DataFrame对象中找到。 如果未传递且left_index和right_index为False,则DataFrame中的列的交集将被推断为连接键。
  • left_on:左侧DataFrame中的列或索引级别用作键。 可以是列名,索引级名称,也可以是长度等于DataFrame长度的数组。
  • right_on: 左侧DataFrame中的列或索引级别用作键。 可以是列名,索引级名称,也可以是长度等于DataFrame长度的数组。
  • left_index: 如果为True,则使用左侧DataFrame中的索引(行标签)作为其连接键。 对于具有MultiIndex(分层)的DataFrame,级别数必须与右侧DataFrame中的连接键数相匹配。
  • right_index: 与left_index功能相似。
  • how: One of ‘left’, ‘right’, ‘outer’, ‘inner’. 默认inner。inner是取交集,outer取并集。比如left:[‘A’,‘B’,‘C’];right[’’A,‘C’,‘D’];inner取交集的话,left中出现的A会和right中出现的买一个A进行匹配拼接,如果没有是B,在right中没有匹配到,则会丢失。’outer’取并集,出现的A会进行一一匹配,没有同时出现的会将缺失的部分添加缺失值。
  • sort: 按字典顺序通过连接键对结果DataFrame进行排序。 默认为True,设置为False将在很多情况下显着提高性能。
  • suffixes: 用于重叠列的字符串后缀元组。 默认为(‘x’,’ y’)。
  • copy: 始终从传递的DataFrame对象复制数据(默认为True),即使不需要重建索引也是如此。
  • indicator:将一列添加到名为_merge的输出DataFrame,其中包含有关每行源的信息。 _merge是分类类型,并且对于其合并键仅出现在“左”DataFrame中的观察值,取得值为left_only,对于其合并键仅出现在“右”DataFrame中的观察值为right_only,并且如果在两者中都找到观察点的合并键,则为left_only。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/145037.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月12日 下午9:40
下一篇 2022年5月12日 下午10:00


相关推荐

  • 程序员必学!智能体(Agent)与工作流(Workflow)构建Agentic系统全解析

    程序员必学!智能体(Agent)与工作流(Workflow)构建Agentic系统全解析

    2026年3月14日
    3
  • MQTT 客户端工具

    MQTT 客户端工具前言在学习和使用 MQTT 的过程中 一个得心应手的客户端工具可以极大的方便使用者进行 MQTT 特性的探索和功能组件的调试 来自世界各地的开发者们围绕不同操作系统 运行平台 开发出了许多针对 MQTT 协议的客户端测试工具 这些客户端工具种类繁多 功能侧重点不尽相同 质量层次不齐 因此 对于初学者乃至 MQTT 专家来说 如何选择一个适用的 MQTT 客户端工具是一个难题 本篇文章将尽可能

    2026年3月18日
    2
  • C语言括号匹配(栈括号匹配c语言)

    给定一串字符,不超过100个字符,可能包括括号、数字、字母、标点符号、空格,编程检查这一串字符中的(),[],{}是否匹配。输入格式:输入在一行中给出一行字符串,不超过100个字符,可能包括括号、数字、字母、标点符号、空格。输出格式:如果括号配对,输出yes,否则输出no。输入样例1:sin(10+20)输出样例1:yes输入样例2:{[}]输出样例2:no思路:题目输入一些字符串,我们就先保留括号之类的,判断是否匹配。如果遇到左括号,就入栈,如果遇到一个右括号,就与栈顶元

    2022年4月13日
    34
  • No input file specified的解决方法apache伪静态

    No input file specified的解决方法apache伪静态

    2021年10月9日
    55
  • 【问题】Win10 system占用cpu资源高

    现象查看具体信息锁定目标:ACPI,跟系统中断有关电源管理,关闭PCIExpress

    2022年4月6日
    52
  • RHEL5使用3322动态域名方法

    RHEL5使用3322动态域名方法连客户端都不用安装 也不用配置文件 不用知道 IP 使用 lynx 一般的 Linux BSD 都自带 就可以了 如果没有的话 安装一下就行 在第三张光盘中 使用方法 lynx mime header auth user pass http www 3322 org dyndns update system dyndns amp hostname myhost 3322 org

    2026年3月18日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号