python实现文本去重复脚本

作者: secflag 分类: Python 发布时间: 2016-12-14 17:24

平时使用中经常用到去除文本中的重复行问题,最近开始接触Python,使用Python实现脚本效果如下

python代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# 去除文本中的重复行
import sys  
def filedelrepeat(filename):
	try:
		file=open(filename,'r')
		links=file.readlines()
		file.close()
		lines=set()
		for link in links:
			lines.add(link)
		print u'文件名: ' + filename
		print u'原有行:' + str(len(links))
		file=open(filename,'w')
		for line in lines:
			file.write(line)
		file.close()
		print u'剩余行: ' + str(len(lines))
	except Exception,e:
		print str(e)
if len(sys.argv)>1:
	filename=sys.argv[1]
else:
	filename='repeat.txt'
filedelrepeat(filename)

下载地址

http://files.secflag.com/script/delrepeat.py