postgresql表如何去重-PostgreSQL-Python学习网

postgresql表如何去重

yang2020-04-08 13:35:42原创

去重的方法一般是找到重复数据中的一条，以某一唯一条件去掉其他重复值。PostgreSQL 库如何去除单表重复数据呢？可以通过 ctid 进行，下面我们就来看一下PostgreSQL去重的方法。

一、创建测试表

david=# create table emp (
david(# id int,
david(# name varchar);
CREATE TABLE
david=#

二、插入测试数据

david=# insert into emp values (1, 'david');
INSERT 0 1
david=# insert into emp values (1, 'david');
INSERT 0 1
david=# insert into emp values (1, 'david');
INSERT 0 1
david=# insert into emp values (2, 'sandy');
INSERT 0 1
david=# insert into emp values (2, 'sandy');
INSERT 0 1
david=# insert into emp values (3, 'renee'); 
INSERT 0 1
david=# insert into emp values (4, 'jack');  
INSERT 0 1
david=# insert into emp values (5, 'rose'); 
INSERT 0 1
david=#

三、查询初始化数据

david=# select ctid, * from emp;
 ctid  | id | name  
-------+----+-------
 (0,1) |  1 | david
 (0,2) |  1 | david
 (0,3) |  1 | david
 (0,4) |  2 | sandy
 (0,5) |  2 | sandy
 (0,6) |  3 | renee
 (0,7) |  4 | jack
 (0,8) |  5 | rose
(8 rows)

david=#

查询重复数据数

david=# select distinct id, count(*) from emp group by id having count(*) > 1;
 id | count 
----+-------
|     3
|     2
(2 rows)

david=#

查询出 id 为1的记录有3条，id 为2的记录有2条。

四、查询要保留的数据

以 min(ctid) 或 max(ctid) 为准。

david=# select ctid, * from emp where ctid in (select min(ctid) from emp group by id);
 ctid  | id | name  
-------+----+-------
 (0,1) |  1 | david
 (0,4) |  2 | sandy
 (0,6) |  3 | renee
 (0,7) |  4 | jack
 (0,8) |  5 | rose
(5 rows)

david=#

五、删除重复数据

david=# delete from emp where ctid not in (select min(ctid) from emp group by id);
DELETE 3
david=#

六、查看最后结果

david=# select ctid, * from emp;
 ctid  | id | name  
-------+----+-------
 (0,1) |  1 | david
 (0,4) |  2 | sandy
 (0,6) |  3 | renee
 (0,7) |  4 | jack
 (0,8) |  5 | rose
(5 rows)

david=#

推荐：PostgreSQL教程

专题推荐：postgresql

8天深入理解Python视频教程（黑马云课堂）

Python, 是一种面向对象、解释型计算机程序设计语言，由Guido van Rossum于1989年发明，第一个公开发行版发行于1991年。 Python是纯粹的自由软件，源代码和解释器CPython遵循 GPL(GNU General Public License)协议。 Python语法简洁清晰，特色之一是强制用空白符(white space)作为语句缩进。 Python具有丰富和强大的库。它常被昵称为胶水语言，能够把用其他语言制作的各种模块（尤其是C/C++）很轻松地联结在一起。《黑马云课堂8天深入理解Python视频教程》带你深入理解Python语言

Python3 Selenium3 自动化测试开发实战

本套Python自动化测试教程零基础讲解自动化测试， selenium 安装到八种元素定位，用户事件处理，等待时间处理，到单元测试框架 Unitest 整合实战，整合自动化测试项目实战，新版本HTML TestRnner 生成测试报告，自动化发送测试报告邮件等核心知识点

MySQL权威开发指南(php中文网)

php中文网原创mysql教程之《MySQL权威开发指南（教程）》为php中文网欧阳克老师主讲。本课程为MYSQL基础视频教程，主要讲解mysql数据库基础、搭建、数据类型、增删改查的基本操作等！非常适合mysql初学者学习！

postgresql表如何去重

相关文章推荐

相关课程推荐

8天深入理解Python视频教程（黑马云课堂）

Python3 Selenium3 自动化测试开发实战

MySQL权威开发指南(php中文网)

全部评论我要评论

Python学习网