搜索引擎和网站都在采集大量信息 非原创即采集
采集信息的程序一般被称为网络爬虫(web crawler)
网络铲 web scraper 类比考古用的洛阳铲
网络蜘蛛web spider
一般爬到 对应网页上 再把需要的信息 铲 下来
言词证据 在不断变化