两个Dataframe,df1 和 df2
创新互联建站主要从事网站建设、成都网站建设、网页设计、企业做网站、公司建网站等业务。立足成都服务山南,十多年网站建设经验,价格优惠、服务专业,欢迎来电咨询建站服务:18982081108
df1与df2的差集
将交集追加进df1,然后删除所有重复项
df1与df2的并集
将交集追加进df1,然后保留第一次出现的行,删除后面的重复行
keep = first 可以不写,默认值为first,也可等于last,表示保留最后一次出现的重复行
如果原数据是唯一的,就把每一个元素,添加到一个字典中
最终获得类似{"A1":5,"A3":2,"D1":5,"D3":10}的字典,也就是记录每一个元素出现的次数,如果是10个元组的交集,那么次数=10。
python中set()函数的用法如下:
工具/原料:台式电脑、Win10、Python3.6.5。
1、首先按下“Win+R”组合键,打开运行窗口,如下图所示。
2、在打开文本框输入“cmd”,点击确定,如下图所示。
3、在打开的cmd窗口中,输入:“python”,点击Enter键,如下图所示。
4、在Python环境中,输入:“x = set(('hi', 'hello', 'world'))”,点击Enter键,如下图所示。
5、在Python环境中,输入:“print(x)”,如下图所示。
6、点击Enter键,即可使用Python内置的set()函数创建一个集合对象,并打印出来,如下图所示。
我们在遇到一些问题的时候,使用集合的交集、并集和差集能够更便捷的帮助我们去解决问题,看下面一个例子。
某学校有两个班级,班级A需要学习数学、语文、英语、物理、化学和生物,班级B需要学习数学、语文、英语、政治、地理和历史。
我们可以直接看出A班级和B班级的交集为数学、语文和英语,并集为数学、语文、英语、物理、化学、生物、政治、地理、历史,A和B的差集为物理、化学和生物。
那么怎么使用Python去完成这些运算?
我们先在这里定义两个集合,
因为是求交集,因此A和B的位置调换依然不影响结果。
使用集合求并集的方式同样也是两种方式,一种是使用 ‘|’ 运算符进行操作,一种是使用 union() 方法来实现。
求并集的时候同样不需要注意 A 和 B 的位置关系。
使用集合求差集的方式同样也是两种方式,一种是使用 ‘-’ 运算符进行操作,一种是使用 difference() 方法来实现。
在方法2中注意 A 和 B 的位置不同的时候是有区别的,如果是 A 使用 difference() 方法,那么是输出 A 中有而 B 中没有的元素,如果是 B 使用 difference() 方法,那么是输出 B 中有而 A 中没有的元素。
学习完了集合,四种核心集合我们已经基本掌握,接下来几节我们来通过学习一些字符串的相关操作,学习字符串的过程中会穿插着前面简单介绍过但没仔细讲解的方法及操作。