会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
中科院院士
博客园
首页
新随笔
联系
订阅
管理
2020年8月1日
如何快速从gitgub上pull一个新的项目
摘要: 众所周知从github上拉一个项目速度特别的慢,最近看见了一个大佬的介绍后将此方法特意将此方法记录下来与更多码友分享下, 操作步骤如图所示 很简单只需在github.com后面加上cnpmjs.org即可.然后你会发现速度比原来快了很多
阅读全文
posted @ 2020-08-01 23:29 中科院院士
阅读(262)
评论(0)
推荐(0)
2020年7月6日
idea中maven项目中引入第三方jiar包以及最终打包部署系列
摘要: 项目中会偶尔遇到有些jar包无法在maven中添加坐标的情况,这时我们只能通过外部下载的方式将第三方的jar包下载下来,然后引入到项目中去.下面详细介绍如何引入. 方式一: 1.第一步如下 2.第二步: 在 “Dependencies” 标签界面下,点击右边绿色的 “+”号,选择第一个选项“JARs
阅读全文
posted @ 2020-07-06 13:57 中科院院士
阅读(536)
评论(0)
推荐(0)
2019年6月24日
完美解决windows与ubuntu双向复制问题(亲测有效)
摘要: 打开Ubuntu的终端输入如下命令即可:
阅读全文
posted @ 2019-06-24 13:17 中科院院士
阅读(1154)
评论(1)
推荐(1)
2019年4月29日
xshell终端向远程服务器上传文件方法
摘要: centos-7下在本地终端里向远程服务器上传文件,在命令行中执行的软件. 安装命令如下: 在终端里输入如下命令: 会弹出如下窗口 选择你要上传的文件即可上传成功.
阅读全文
posted @ 2019-04-29 17:22 中科院院士
阅读(869)
评论(0)
推荐(0)
2019年4月3日
scrapy 爬虫的暂停与重启
摘要: 暂停爬虫项目 首先在项目目录下创建一个文件夹用来存放暂停爬虫时的待处理请求url以及其他的信息.(文件夹名称:job_info) 在启动爬虫项目时候用pycharm自带的终端启动输入下面的命令: 该命令运行后按下一次ctrl+c后scrapy接收到一次暂停的信号注意这里只能按一次ctrl+c如果按了
阅读全文
posted @ 2019-04-03 22:59 中科院院士
阅读(2276)
评论(0)
推荐(0)
让selenium中的Cromerderive不加载图片设置
摘要: 把配置参数(chrom_opt)设置好后将其添加到 这样就可以让selenium不加载图片了,可以快速的提高爬虫的效率.
阅读全文
posted @ 2019-04-03 12:08 中科院院士
阅读(499)
评论(0)
推荐(0)
2019年4月2日
爬虫中xpath的特殊用法
摘要: Xpath之starts-with(@属性名称,属性字符串相同部分) 以相同的字符开头的用法 在做爬虫时解析html的源码时候可能会遇见以下这种标签, 我们发现这种标签都是id属性名称相差了一个数字或其他的字符串而已,在提取数据时完全没必要写三次xpath表达式.可以直接用以下这种方法去提取数据,
阅读全文
posted @ 2019-04-02 15:09 中科院院士
阅读(450)
评论(0)
推荐(0)
2019年3月19日
python 之生成器的介绍
摘要: # 用生成器(generators)方便地写惰性运算 1 def double_numbers(iterable): 2 for i in iterable: 3 yield i + i # 生成器只有在需要时才计算下一个值。它们每一次循环只生成一个值,而不是把所有的# 值全部算好。# range的返回值也是一个生成器,不然一个1到900000000的列表会花很多时间和...
阅读全文
posted @ 2019-03-19 17:30 中科院院士
阅读(166)
评论(0)
推荐(0)
公告