点点滴滴的积累

yanchao

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
今天遇到 一个 问题 需要从一堆乱码 和 文本中 提取出 网址

弄了半天 明白了 可以用这个
grep -o http:.* d.txt    -o表示 只要 输出 匹配的 内容  . 表示 任意一个 字符   *表示 任意个 任意字符

但是发现 出来的结果 有很多 后面 跟着 很多 _ _ _ _ _____________________________乱码  所以呢 有用了 sed替换


sed -i 's/_ _//g d.txt

最后 发现 有些 结尾 还是 _ 最后 用 _$ 去除掉了

刚刚开始搞linux的文本处理  还这么不熟练 和 不简洁 要继续努力 恩恩
posted on 2008-11-29 22:04  yanchao  阅读(270)  评论(0编辑  收藏  举报