当前位置： > 认证考试 > Oracle认证 > 文章内容

groupby去重(groupby去重计数)

http://www.itjxue.com 2023-01-28 13:52 来源:未知 点击次数:

去重是distinct还是group by

他们的功能基本上是不一样的。distinct消除重复行。groupby是分组语句。举例来说可能方便一点。A表idnuma1b2c3a4c7d3e5如果只选出id列，用distinct和groupby一样的。selectdistinct(id)fromA;idabcde;selectidfromAgroupbyi

c# linq groupby是默认去掉重复行吗

groupby 是分组统计用的，不是去掉重复行的！！会根据你选择的字段不同而发生不同的结果！！

但是喃，你可以当作是去掉重复行用，只是保证你的查询数据集结果显示上没重复

比如

字段A，字段B，字段C

1 2 3

1 3 4

2 1 3

3 2 1

select 字段A FROM ... GROUPBY 字段A

结果就是

select 字段A FROM ... GROUPBY 字段B

结果就是

所以要去重复的话，那么你要谨慎了，GROUPBY 后面的字段必须要在你的查询字段中出现，不然就会有问题的！！

对单个字段的结果进行去重，distinct和group by谁的执行效率快？

那要看字段有多大。

distinct方式就是两两对比，需要遍历整个表。

group by分组类似先建立索引再查索引，所以两者对比，小表destinct快，不用建索引。大表group by快。一般来说小表就算建索引，也不会慢到哪去，但是如果是TB级大表，遍历简直就是灾难。

所以很多ORACLE项目都禁止使用distinct语句，全部要求替换成group by。

python中对list去重的多种方法

今天遇到一个问题，在同事随意的提示下，用了 itertools.groupby 这个函数。不过这个东西最终还是没用上。

问题就是对一个list中的新闻id进行去重，去重之后要保证顺序不变。

直观方法

最简单的思路就是：

这样也可行，但是看起来不够爽。

用set

另外一个解决方案就是用set：

代码如下:

ids = [1,4,3,3,4,2,3,4,5,6,1]

ids = list(set(ids))

这样的结果是没有保持原来的顺序。

按照索引再次排序

最后通过这种方式解决：

代码如下:

ids = [1,4,3,3,4,2,3,4,5,6,1]

news_ids = list(set(ids))

news_ids.sort(ids.index)

使用itertools.grouby

文章一开始就提到itertools.grouby, 如果不考虑列表顺序的话可用这个：

代码如下:

ids = [1,4,3,3,4,2,3,4,5,6,1]

ids.sort()

it = itertools.groupby(ids)

for k, g in it:

print k

关于itertools.groupby的原理可以看这里：

网友补充：用reduce

网友reatlk留言给了另外的解决方案。我补充并解释到这里：

代码如下:

In [5]: ids = [1,4,3,3,4,2,3,4,5,6,1]

In [6]: func = lambda x,y:x if y in x else x + [y]

In [7]: reduce(func, [[], ] + ids)

Out[7]: [1, 4, 3, 2, 5, 6]

上面是我在ipython中运行的代码，其中的 lambda x,y:x if y in x else x + [y] 等价于 lambda x,y: y in x and x or x+[y] 。

Python常用的几种去重方法

case1:用集合的特性set()，去重后顺序会改变

case1.1：可以通过列表中索引（index）的方法保证去重后的顺序不变

case2:使用循环查找的方式，不改变顺序

case3:通过删除索引

case4:itertools.groupby

case5:fromkeys

case6:reduce方法

oracle查询出来的数据怎么消除重复数据？

Oracle数据库重复的数据一般有两种去重方法，一、完全重复数据去重;二、部分字段数据重复去重。

一、完全重复数据去重方法

对于表中完全重复数据去重，可以采用以下SQL语句。

Code

CREATETABLE"#temp"AS (SELECTDISTINCT * FROM 表名);--创建临时表，并把DISTINCT 去重后的数据插入到临时表中

truncateTABLE 表名;--清空原表数据

INSERTINTO 表名(SELECT * FROM"#temp");--将临时表数据插入到原表中

DROPTABLE"#temp";--删除临时表

具体思路是，首先创建一个临时表，然后将DISTINCT之后的表数据插入到这个临时表中;然后清空原表数据;再讲临时表中的数据插入到原表中;最后删除临时表。

二、部分数据去重方法

首先查找重复数据

select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) 1

将上面的号改为=号就可以查询出没有重复的数据了。

想要删除这些重复的数据，可以使用下面语句进行删除：

deletefrom 表名 a where 字段1,字段2 in

(select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) 1)

oracle产品服务

甲骨文公司产品主要有以下几类：

甲骨文股份有限公司

1.服务器及工具

数据库服务器：2013年最新版本Oracle 12C。

应用服务器：Oracle Application Server。

开发工具：OracleJDeveloper，Oracle Designer，Oracle Developer，等等。

2.企业应用软件

企业资源计划(ERP)软件。已有10年以上的历史。2005年，并购了开发企业软件的仁科软件公司(PeopleSoft)以增强在这方面的竞争力。

客户关系管理(CRM)软件。自1998年开始研发这种软件。2005年，并购了开发客户关系管理软件的希柏软件公司(Siebel)。

3. Oracle职业发展力计划(Oracle WDP)

Oracle WDP 全称为Oracle Workforce Development Program，是Oracle (甲骨文)公司专门面向学生、个人、在职人员等群体开设的职业发展力课程。Oracle的技术广泛应用于各行各业，其中电信、电力、金融、政府及大量制造业都需要Oracle技术人才，Oracle公司针对职业教育市场在全球推广的项目，其以低廉的成本给这部分人群提供Oracle技术培训，经过系统化的实训，让这部分人群能够迅速掌握Oracle最新的核心技术，并能胜任企业大型数据库管理、维护、开发工作。

(责任编辑：IT教学网)

复制链接发给好友收藏本文关闭此页

上一篇：page对象的作用范围(page对象的属性有哪些)

下一篇：substr函数用法js(substr函数用法)

groupby去重(groupby去重计数)

去重是distinct还是group by

c# linq groupby是默认去掉重复行吗

对单个字段的结果进行去重，distinct和group by谁的执行效率快？

python中对list去重的多种方法

Python常用的几种去重方法

oracle查询出来的数据怎么消除重复数据？

(责任编辑：IT教学网)

相关Oracle认证文章

阅读排行

专题教程

推荐Oracle认证文章

最新更新Oracle认证