表查询: 合并查询:使用union关键字,可将满足条件的重复行去掉。 代码如下: select ename,sal,job from emp where sal > 2500 union select ename,sal,job from emp where job = ‘MANAGER’; 而union all用法和union相似,但是不会取消重复行。 intersect 用来取两个结果的交集。 minus用来取两个结果的差集。 使员工scott的岗位,工资,补助与SMITH员工一样
代码如下:–合并重复行 select * from A union select * from B –不合并重复行 select * from A union all select * from B 按某个字段排序 –合并重复行 select * from ( select * from A union select * from B) AS T order by 字段名 –不合并重复行 select * from ( select * from A union all select * fro
pandas读取一组数据,可能存在重复索引,虽然可以利用drop_duplicate直接删除,但是会删除重要信息。
比如同一ID用户,多次登录学习时间。要计算该用户总共‘’学习时间‘’,就要把重复的ID的‘’学习时间‘’累加。
可以结合groupby和sum函数完成该操作。
实例如下:
新建一个DataFrame,计算每个 id 的总共学习时间。其中 id 为one/two的存在重复学习时间。先利用 groupby 按照键 id 分组,然后利用sum()函数求和,即可得到每个id的总共学习时间。