第1个回答 2006-09-15
表中有40列,50000行数据.其中许多行是重复的.我想把重复行找出来,剩下不重复的.
第一个方法:全选数据--筛选--高级筛选--选择不重复记录+“建立一个没有筛选条件的条件区域(只包含标题栏)”--将筛选结果复制到其他位置--确定
————这样应该不会漏掉个别列(另外在运行时,最好关掉一些不相关程序,因数据量太大)
你的第二个方法,其实就是把所有数据当作一列进行处理;碰巧我这儿有一个52000多行的数据,我做了一些,没问题,但太慢;
另外:提醒一下,去除重复数据,特别是多列的,一定要保证相同数据的每行的内容、格式完全相同;如果是手工输入或多表合并的一般很难保证,这要做预处理;所以你觉得筛选出数据不对,可能有这方面原因。
祝你成功
第2个回答 2006-09-16
感谢楼主特地留消息邀请我来回答此问题,经过思考,我作出如下回答,希望你满意(注:用我的方法所得到的答案中,若某项记录有N个重复记录(N>1),则只留下一个记录,而其他的N-1个记录被排除掉了):
我假设你的数据区域中无字段行,并且数据存放于A1:AN50000的区域中,然后你可按如下的次序进行操作:
1.在第1行第41列AO1中输入如下公式:=A1
2.在第1行第42列AP1中输入如下公式:=AO1&" "&B1
3.选中AP1单元格,利用右下角的填充柄向右边的38个单元格复制公式,一直复制到CB1单元格为止
4.选中AO1:CB1区域,并利用CB1右边的填充柄向下面所有有数据的行复制公式
5.选中A1:CB50000的区域,并进行排序,排序的条件是:以CB列为关键字进行排序
6.在CC2单元格中输入如下公式=IF(CB1=CB2,"重复","")
7.选中CC2单元格,然后利用CC2右边的填充柄向下面所有有数据的行复制公式
8.利用筛选命令筛选出CC列中值是空的所有行,这些就是你所要的无
重复的记录.
另外,有别人说可用分类的方法来解决此问题,只是一个EXCEL表中最多只允许有65536行,只怕这个行数限制无法完成分类的需要(因为楼主的数据有50000行,分类时会增加许多行),但如果只有几千行数据应该可以用分类来解决.
第4个回答 2006-09-15
你的2个方法应该没错.
检查过你的数据是否包含不可见字符吗?如空格之类.
可以这样检查:
你的第二种方法"F列输入=A1&B1&C1..."
把F列选择性(数值)粘贴到另一个表的A列里,排序,
在B2输入=EXACT(A1,A2)
向下复制公式,相等的为TRUE,
看看你认为重复的数据是否真的重复.
会用VLOOKUP函数吗?可以用它把检查结果对照回原表.