浙江省高等学校教师教育理论培训

微信搜索“毛凌志岗前心得”小程序

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

在做data mining,很重要的一部是对数据进行清洗,由于数据量巨大,我是分段从数据库中取出数据存成文本格式,最后再将所有的文本合并成一个大的文件,

在文件合并的过程中,我用了一个小工具,

Txtunit.exe,短小精悍,

合并完之后会有一些空白行的出现,我们需要将这些空白行清除掉,做法参见

emeditor删除空行 - HOHO网页设计 - 51CTO技术博客

主要是使用了一个匹配的正则 ^[ \t]*\n

posted on 2009-12-25 09:34  lexus  阅读(371)  评论(0编辑  收藏  举报