常见的SQL疑难问题的解决

转帖|其它|编辑:郝浩|2009-01-08 12:00:44.000|阅读 1138 次

概述:常见的SQL疑难问题的解决

# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>

文章关键字:|常见|SQL|疑难|问题|解决|选择|序列号|

常见的SQL问题:

选择重复,消除重复和选择出序列

有例表:emp

emp_no name age

001 Tom 17

002 Sun 14

003 Tom 15

004 Tom 16

要求:

列出所有名字重复的人的记录

(1)最直观的思路:要知道所有名字有重复人资料,首先必须知道哪个名字重复了:

select name from emp group by name having count(*) >1

所有名字重复人的记录是:

select * from emp where name in ( select name from emp group by name having count(*) >1)

(2)稍微再聪明一点,就会想到,如果对每个名字都和原表进行比较,大于2个人名字与这条记录相同的就是合格的,就有

select * from emp where (select count(*) from emp e where e.name=emp.name)>1

--注意一下这个>1,想下如果是 =1,如果是 =2 如果是>2 如果e是另外一张表而且是=0那结果 就更好玩了:)这个过程是在判断工号为001的 人的时候先取得001的名字(emp.name)然后和原表的名字进行比较e.name。注意e是emp的一个别名。

再稍微想得多一点,就会想到,如果有另外一个名字相同的人工号不与她他相同那么这条记录符合要求:

select * from emp where exists(select * from emp e where e.name=emp.name and e.emp_no<>emp.emp_no)

此思路的join写法:

select emp.* from emp,emp e where emp.name=e.name and emp.emp_no<>e.emp_no

/*

这个语句较规范的join写法是

select emp.* from emp inner join emp e on emp.name=e.name and emp.emp_no<>e.emp_no

但个人比较倾向于前一种写法,关键是更清晰

*/

b、有例表:emp

name age

Tom 16

Sun 14

Tom 16

Tom 16

要求:

过滤掉所有多余的重复记录

(1)我们知道distinct、group by 可以过滤重复,于是就有最直观的

select distinct * from emp

select name,age from emp group by name,age

获得需要的数据,如果可以使用临时表就有解法:

select distinct * into #tmp from emp

delete from emp

insert into emp select * from #tmp

(2)但是如果不可以使用临时表,那该怎么办?

我们观察到我们没办法区分数据(物理位置不一样,对 SQL Server来说没有任何区别),思路自然是想办法把数据区分出来了,既然现在的所有的列都没办法区分数据,唯一的办法就是再加个列让它区分出来,加什么列好?最佳选择是identity列:

alter table emp add chk int identity(1,1)

表示例:

name age chk

Tom 16 1

Sun 14 2

Tom 16 3

Tom 16 4

重复记录可以表示为:

select * from emp where (select count(*) from emp e where e.name=emp.name)>1

要删除的是:

delete from emp where (select count(*) from emp e where e.name=emp.name and e.chk>=emp.chk)>1

再把添加的列删掉,出现结果。

alter table emp drop column chk

(3)另一个思路:

视图

select min(chk) from emp group by name having count(*) >1

获得有重复的记录chk最小的值,于是可以

delete from emp where chk not in(select min(chk) from emp group by name)

写成join的形式也可以:

(1)有例表:emp

emp_no name age

001 Tom 17

002 Sun 14

003 Tom 15

004 Tom 16

要求生成序列号

(1)最简单的方法,根据b问题的解法:

alter table emp add chk int identity(1,1)

或 select *,identity(int,1,1) chk into #tmp from emp

如果需要控制顺序怎么办?

select top 100000 *,identity(int,1,1) chk into #tmp from emp order by age

(2) 假如不可以更改表结构,怎么办?

如果不可以唯一区分每条记录是没有办法的,在可以唯一区分每条记录的时候,可以使用a 中的count的思路解决这个问题

select emp.*,(select count(*) from emp e where e.emp_no<=emp.emp_no) from emp order by (select count(*) from emp e where e.emp_no<=emp.emp_no)


标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@evget.com

文章转载自:赛迪网

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP