Pandas merge函数「建议收藏」

Pandas merge函数「建议收藏」[toc]函数原型pd.merge(left,right,how=’inner’,on=None,left_on=None,right_on=None,left_index=False,right_index=False,sort=True,suffixes=(‘_x’,’_y’),copy=True,indicator=False,validate=None)参数left:拼接的左侧DataFrame对象r.

大家好,又见面了,我是你们的朋友全栈君。

	[toc]

函数原型

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,
         left_index=False, right_index=False, sort=True,
         suffixes=('_x', '_y'), copy=True, indicator=False,
         validate=None)

参数

  • left: 拼接的左侧DataFrame对象
  • right: 拼接的右侧DataFrame对象
  • on: 要加入的列或索引级别名称。 必须在左侧和右侧DataFrame对象中找到。 如果未传递且left_index和right_index为False,则DataFrame中的列的交集将被推断为连接键。
  • left_on:左侧DataFrame中的列或索引级别用作键。 可以是列名,索引级名称,也可以是长度等于DataFrame长度的数组。
  • right_on: 左侧DataFrame中的列或索引级别用作键。 可以是列名,索引级名称,也可以是长度等于DataFrame长度的数组。
  • left_index: 如果为True,则使用左侧DataFrame中的索引(行标签)作为其连接键。 对于具有MultiIndex(分层)的DataFrame,级别数必须与右侧DataFrame中的连接键数相匹配。
  • right_index: 与left_index功能相似。
  • how: One of ‘left’, ‘right’, ‘outer’, ‘inner’. 默认inner。inner是取交集,outer取并集。比如left:[‘A’,‘B’,‘C’];right[’’A,‘C’,‘D’];inner取交集的话,left中出现的A会和right中出现的买一个A进行匹配拼接,如果没有是B,在right中没有匹配到,则会丢失。’outer’取并集,出现的A会进行一一匹配,没有同时出现的会将缺失的部分添加缺失值。
  • sort: 按字典顺序通过连接键对结果DataFrame进行排序。 默认为True,设置为False将在很多情况下显着提高性能。
  • suffixes: 用于重叠列的字符串后缀元组。 默认为(‘x’,’ y’)。
  • copy: 始终从传递的DataFrame对象复制数据(默认为True),即使不需要重建索引也是如此。
  • indicator:将一列添加到名为_merge的输出DataFrame,其中包含有关每行源的信息。 _merge是分类类型,并且对于其合并键仅出现在“左”DataFrame中的观察值,取得值为left_only,对于其合并键仅出现在“右”DataFrame中的观察值为right_only,并且如果在两者中都找到观察点的合并键,则为left_only。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/145037.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月12日 下午9:40
下一篇 2022年5月12日 下午10:00


相关推荐

  • 全国产深度推理大模型讯飞星火X1推理性能再次升级

    全国产深度推理大模型讯飞星火X1推理性能再次升级

    2026年3月14日
    7
  • 小波包分解树

    小波包分解树小波包将原始信号逐级向下分解 图 1 为用 MATLAB 绘制的小波包分解树 分解层数为 3 层 树中节点的命名规则如下 从 1 0 开始 1 0 为 1 号 1 1 是 2 号 依次类推 3 0 是 7 号 3 7 是 14 号 每个节点都有对应的小波包系数 此系数决定了频率的大小 即频域信息 节点的顺序决定了时域信息 即频率变化的顺序 图 2 为信号的时间频率图 x 轴表示信号的时间变化 y 轴上显示的数字对

    2026年3月18日
    2
  • oracle listagg限制4000 varchar 使用xmlagg解决[通俗易懂]

    oracle listagg限制4000 varchar 使用xmlagg解决[通俗易懂]由于在使用中listagg中的字段值拼接起来后长度超过4000,报以下错误:经查询发现是listagg结果长度限制为Varchar4000,帮改为以下方式解决:使用xmlagg:selectrtrim(xmlagg(XMLELEMENT(e,N,’,’).EXTRACT(‘//text()’)).GetClobVal(),’,’) fromtest_name;标准如下…

    2025年9月24日
    11
  • Codeforces Beta Round #10 B. Cinema Cashier (树状数组)

    Codeforces Beta Round #10 B. Cinema Cashier (树状数组)

    2021年12月6日
    41
  • implementation和api的区别

    implementation和api的区别关于 implementati 和 api 的区别 一共分为两个方面 一 编译范围关于这一部分 参考官网 说的很清楚 implementati Gradle 会将依赖项添加到编译类路径 并将依赖项打包到构建输出 不过 当您的模块配置 implementati 依赖项时 会让 Gradle 了解您不希望该模块在编译时将该依赖项泄露给其他模块 也就是说 其他模块只有在运行时才能

    2026年3月17日
    2
  • 【读书】领导力的5个层次-概述

    【读书】领导力的5个层次-概述领导力的 5 个层次概述 领导力定义 nbsp nbsp nbsp nbsp nbsp nbsp nbsp 本书作者对领导的定义是 领导力就是影响力 在作者的另一本书 中层领导力 自我修行篇 中 作者又说 领导力是拥有追随者的能力 一旦明确了领导力的定义是拥有追随者的能力 你就要参考这一点弄清楚如何去领导他人 引导他人 罗伯特 戴伦在他的 Powerandinfl 一书中分享的 铁三角 理念将帮助领导者站在最前沿并获

    2026年3月20日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号