linux 文本处理一瞥

今天遇到一个问题需要从一堆乱码和文本中提取出网址

弄了半天明白了可以用这个
grep -o http:.* d.txt －o表示只要输出匹配的内容 . 表示任意一个字符＊表示任意个任意字符

但是发现出来的结果有很多后面跟着很多 _ _ _ _ _____________________________乱码所以呢有用了 sed替换

sed -i 's/_ _//g d.txt

最后发现有些结尾还是 _ 最后用 _$ 去除掉了

刚刚开始搞linux的文本处理还这么不熟练和不简洁要继续努力恩恩