摘要:
很多时候,发现phantomjs被一些网站屏蔽导致我们无法达到想要的结果,一方面phantomjs也停止维护,这时候们可以使用chromedriver(谷歌)或者firefoxdriver(火狐)来代替phantomjs,在Windows下我们只要下载chromedriver或者firefoxdri 阅读全文
摘要:
在很多云服务中,经常会遇到云存储数据库没有公网(外网)地址,只有内网地址,这导致在公司网无法访问,这是一个很困扰的问题,这时我们可以使用rinetd进行转发实现外网连接。 首先需要一台能够连接上数据库的liunx服务器,在服务器上安装rinetd。 打开配置项: vi /etc/rinetd.con 阅读全文
摘要:
什么是crond? crond是Linux系统用来定期执行命令或指定程序的服务的一种服务或软件。一般情况下当我们安装完成Linux操作系统之后,默认便会启动Crond任务调用服务。Crond服务会定期(默认一分钟检查一次)检查系统中是否有要执行的任务工作。如果有,便根据其预先设定的定时任务规则自动执 阅读全文
摘要:
ps aux|grep python|grep -v grep|cut -c 9-15|xargs kill -15 管道符“|”用来隔开两个命令,管道符左边命令的输出会作为管道符右边命令的输入。下面说说用管道符联接起来的几个命令: “ps aux”是linux 里查看所有进程的命令。这时检索出的进 阅读全文
摘要:
jieba(结巴)是一个强大的分词库,完美支持中文分词,做为最好的Python中文分词组件。 安装:pip install jieba 特点 支持三种分词模式: 1.精确模式,试图将句子最精确地切开,适合文本分析; output : 今天天气,真,好 cut_all参数默认为False,所有使用cu 阅读全文