今天遇到 一个 问题 需要从一堆乱码 和 文本中 提取出 网址
弄了半天 明白了 可以用这个
grep -o http:.* d.txt -o表示 只要 输出 匹配的 内容 . 表示 任意一个 字符 *表示 任意个 任意字符
但是发现 出来的结果 有很多 后面 跟着 很多 _ _ _ _ _____________________________乱码 所以呢 有用了 sed替换
sed -i 's/_ _//g d.txt
最后 发现 有些 结尾 还是 _ 最后 用 _$ 去除掉了
刚刚开始搞linux的文本处理 还这么不熟练 和 不简洁 要继续努力 恩恩
弄了半天 明白了 可以用这个
grep -o http:.* d.txt -o表示 只要 输出 匹配的 内容 . 表示 任意一个 字符 *表示 任意个 任意字符
但是发现 出来的结果 有很多 后面 跟着 很多 _ _ _ _ _____________________________乱码 所以呢 有用了 sed替换
sed -i 's/_ _//g d.txt
最后 发现 有些 结尾 还是 _ 最后 用 _$ 去除掉了
刚刚开始搞linux的文本处理 还这么不熟练 和 不简洁 要继续努力 恩恩