博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pandas.merge数据连接合并
阅读量:5248 次
发布时间:2019-06-14

本文共 913 字,大约阅读时间需要 3 分钟。

 

(博主录制)

 

一、merge函数用途

pandas中的merge()函数类似于SQL中join的用法,可以将不同数据集依照某些字段(属性)进行合并操作,得到一个新的数据集。

二、merge()函数的具体参数

用法:

DataFrame1.merge(DataFrame2, how=‘inner’, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=(’_x’, ‘_y’))

参数说明

how: One of ‘left’, ‘right’, ‘outer’, ‘inner’. 默认inner。

inner是取交集,outer取并集。
比如left:[‘A’,‘B’,‘C’];right[’'A,‘C’,‘D’];
inner取交集的话,left中出现的A会和right中出现的买一个A进行匹配拼接,如果没有是B,在right中没有匹配到,则会丢失。
'outer’取并集,出现的A会进行一一匹配,没有同时出现的会将缺失的部分添加缺失值。

sort: 按字典顺序通过连接键对结果DataFrame进行排序。 默认为True,设置为False将在很多情况下显着提高性能。
suffixes: 用于重叠列的字符串后缀元组。 默认为(‘x’,’ y’)。

python脚本实例

作者邮箱 231469242@qq.com import pandas as pdimport numpy as npdf1=pd.read_excel("data1.xlsx")df2=pd.read_excel("data2.xlsx")df_combine=pd.merge(df1,df2,how='inner',on='appl_no',suffixes=('_df1','_df2'))data2

data1.xlsx

data2.xlsx

combine.xlsx

 

(博主视频教学主页)

 

转载于:https://www.cnblogs.com/webRobot/p/11484693.html

你可能感兴趣的文章
Java使用JNDI技术获取DataSource对象
查看>>
PHP做APP接口时,如何保证接口的安全性??????????
查看>>
RabbitMQ AMQP (高级消息队列协议)
查看>>
图(有向)-拓扑排序
查看>>
Loadrunner之HTTP接口测试脚本实例
查看>>
Activity,Fragment的状态保存
查看>>
jQuery学习笔记——Chaining
查看>>
BizTalk动手实验(十五)AS2消息安全传输
查看>>
Django的form表单之文件上传
查看>>
SQL中的数字格式化 (收藏)
查看>>
lambda表达式之方法引用
查看>>
转 ALV报表开发模板
查看>>
Linux查看程序端口占用情况
查看>>
[转载]如何在LinqToSql项目中应用TransactionScope数据库事务
查看>>
【c++】字符串流输出恢复状态问题
查看>>
Linux之sed
查看>>
layui关闭弹出层
查看>>
web.xml详解
查看>>
【解决方案】关于Extjs下拉框不显示的问题
查看>>
Newtonsoft.Json 的序列化与反序列化
查看>>