会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
天马行宇
博客园
首页
博问
闪存
新随笔
订阅
管理
上一页
1
2
3
4
5
6
7
下一页
2019年11月29日
bs4 - Beautiful Soup
摘要: 转载自 https://www.cnblogs.com/gl1573/p/9480022.html 概述 bs4 全名 BeautifulSoup,是编写 python 爬虫常用库之一,主要用来解析 html 标签。 一、初始化 from bs4 import BeautifulSoup soup
阅读全文
posted @ 2019-11-29 10:25 天马行宇
阅读(1353)
评论(0)
推荐(0)
编辑
2019年11月22日
Python3 日志(内置logging模块)
摘要: 转载自: https://www.cnblogs.com/Nicholas0707/p/9021672.html 目录 (一)、日志相关概念 1、日志的作用 2、日志的等级 3、日志字段信息与日志格式 4、日志功能的实现 (二)logging模块 1、 logging模块的日志级别 2、loggin
阅读全文
posted @ 2019-11-22 20:07 天马行宇
阅读(23960)
评论(2)
推荐(2)
编辑
2019年11月21日
linux下删除大量文件(rm 参数过长)
摘要: 今天在服务器上清空一个文件夹的时候,提示我rm的参数过长: cd /home/yyq/htmls # 删除当前文件夹下的所有文件,只能是文件比较少的 rm -r ./* # 文件多的可以这么删除: ls | xargs -n 10 rm -fr ls 命令解释: ls 输出所有的文件名(用空格分割)
阅读全文
posted @ 2019-11-21 11:10 天马行宇
阅读(1683)
评论(0)
推荐(0)
编辑
2019年11月20日
linux free 命令下free/available区别
摘要: 转载于 https://www.jianshu.com/p/2ffeb3a3aa90 例子 [root@VM_16_17_centos bin]# free total used free shared buff/cache available Mem: 1882892 785272 280428
阅读全文
posted @ 2019-11-20 16:20 天马行宇
阅读(3667)
评论(0)
推荐(1)
编辑
2019年11月19日
【elasticsearch】查询结果 高亮显示 ——【转载】
摘要: 总的来说:三种高亮显示 一、plain highlight(默认) 二、posting highlight(性能) 对磁盘的消耗更少 将文本切割为句子,并且对句子进行高亮,效果更好 性能比plain highlight高,因为不需要重新对高亮文本进行分词 三、fast vector highligh
阅读全文
posted @ 2019-11-19 19:11 天马行宇
阅读(3401)
评论(0)
推荐(0)
编辑
2019年11月15日
linux上安装 Elasticsearch及插件
摘要: 一、 准备工作: 安装参考文档: ELK官网:https://www.elastic.co/ ELK官网文档:https://www.elastic.co/guide/index.html ELK中文手册:https://www.elastic.co/guide/cn/elasticsearch/g
阅读全文
posted @ 2019-11-15 16:27 天马行宇
阅读(655)
评论(0)
推荐(0)
编辑
2019年11月10日
JAVA-多版本JDK的安装配置
摘要: 安装包1.7和1.8两个版本的JDK安装包: 正常安装,先装1.7,再装1.8.(1.7安装的时候,有一个地方不让修改路径,所以最终2个版本的JDK都安装在了C盘) 安装完成后的路径: 网上都说安装完需要配置环境变量,但是我配置了,没有效果,CMD中执行“java -version”依旧是1.8.
阅读全文
posted @ 2019-11-10 20:37 天马行宇
阅读(1405)
评论(0)
推荐(0)
编辑
2019年10月21日
Python获取指定文件夹下的文件
摘要: 转载自: https://www.cnblogs.com/dengshihuang/p/8145776.html 本文采用os.walk()和os.listdir()两种方法,获取指定文件夹下的文件名。 一、os.walk() 模块os中的walk()函数可以遍历文件夹下所有的文件。 该函数可以得到
阅读全文
posted @ 2019-10-21 16:25 天马行宇
阅读(48831)
评论(0)
推荐(1)
编辑
2019年10月15日
逗号引起的大坑,str进去,tuple出来,为啥
摘要: 今天被坑的够惨,就这个模式的代码,传参进门前是str,进家再出来就成tuple了,为啥?在家发生了啥。 一顿操作,最终发现,原来是每个self语句后边本应该什么都没有,只接受值,如果接收到值+逗号,就会把值和逗号组合当成元祖处理了。。
阅读全文
posted @ 2019-10-15 19:09 天马行宇
阅读(260)
评论(0)
推荐(0)
编辑
2019年10月5日
Python代码调用JS函数
摘要: 采集过程中,遇到了一个token是经过JS加密生成的,于是乎进行JS断点追踪,生成了完整的生成token值的JS函数文件。 这个JS函数需要在Python代码中调用,通过输入一个参数,然后会输出一个token值。 所需模块: pip install pyexecjs 注意:这里安装的模块叫:pyex
阅读全文
posted @ 2019-10-05 17:39 天马行宇
阅读(9807)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
7
下一页