摘要: html的宗旨: <标签 属性=”属性的值“></标签> 只是对于文本的一种解释划分吧 dom的宗旨: 就是一个大数组,处理方便,效率低 xml <node attr=value>...</node> html是它的子集,树结构 主要注意节点关系 json 类似xml,对JavaScript友好 m 阅读全文
posted @ 2018-09-22 16:37 星涅爱别离 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 和廖雪峰大神的教程学了几遍后,还是出现了许多不足,于是就做一些回顾,列出一些python的细节问题,有一些就提一下,如果发现不清楚的话 还请移步https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e54 阅读全文
posted @ 2018-09-22 16:35 星涅爱别离 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 两个随机变量的独立性表示两个变量X与Y是否有关系(贝叶斯可证),但是关系的强弱(mutual dependence)是无法表示的,为此我们引入了互信息。 其中 p(x,y) 是 X 和 Y 的联合概率分布函数,而p(x)和p(y)分别是 X 和 Y 的边缘概率分布函数。 在连续随机变量的情形下,求和 阅读全文
posted @ 2018-09-21 22:41 星涅爱别离 阅读(2908) 评论(0) 推荐(0) 编辑
摘要: 当我们解析网页后,往往面对繁杂的源代码而无从下手,有时候明明知道我们想要的数据就在里面,可是应该如何把冗余的部分去除而只保留我们想要的那一个部分呢 在这里和大家一起学习一下选择的方法 1、正则表达式 真的是无奈之举的时候才会想到要去正则,因为它除非格式标准,否则每次搜索都要重新的绘制pattern 阅读全文
posted @ 2018-09-14 21:58 星涅爱别离 阅读(317) 评论(0) 推荐(0) 编辑
摘要: 一到开学季,校园里面又开始散发着爱情的酸腐,与其一个人在寝室默默地哭泣,不如上网看看比外面更漂亮的妹子! 嗯,想到这,我忍不住打开了http://jandan.net/ooxx,捏着手中的精灵球,好,今天的少女图鉴就从煎蛋网开始吧!!!冲鸭 打开网页,目标定格在了最后一页 先用f12看一下 发现了, 阅读全文
posted @ 2018-09-04 16:40 星涅爱别离 阅读(543) 评论(0) 推荐(0) 编辑
摘要: https://www.w3cschool.cn/sql/anioefpk.html 阅读全文
posted @ 2018-09-04 12:28 星涅爱别离 阅读(100) 评论(0) 推荐(0) 编辑
摘要: 开学啦,让我们来看看豆瓣上有什么好书吧 首先当然是很正经地访问一下网页啦 网站网址是https://book.douban.com/top250?start=0 那么我们所需要的内容就是图片旁边的信息了,那就先让虫子爬过去吧,上吧小虫虫!!! 好了,get到源代码了,再来看看自己需要的信息在哪里 就 阅读全文
posted @ 2018-09-03 11:01 星涅爱别离 阅读(880) 评论(2) 推荐(0) 编辑
摘要: 对于sql,首先要一个概念,那就是它是一个表,我们查的是某一列,返回的是该列中符合条件的行 好了,理解了这句话,你就已经会了科科,来看看具体的一些语法,真的,很简单,来吧 SQL 使用单引号来环绕文本值(大部分数据库系统也接受双引号)。如果是数值,请不要使用引号。 AND 和 OR 运算符 SELE 阅读全文
posted @ 2018-08-27 12:26 星涅爱别离 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 参考学习的网站链接http://www.w3school.com.cn/xpath/xpath_intro.asp 首先理清楚一些常识 以此为例 参照HTML的格式其实很多都只是换了一下名字而已还是很好上手的 节点(Node) 基本值(或称原子值,Atomic value) 项目(Item) 项目是 阅读全文
posted @ 2018-08-27 11:58 星涅爱别离 阅读(497) 评论(0) 推荐(0) 编辑
摘要: 最近我在网上也看到了很多有意思的东西,发现大家对于爬虫的运用哦真滴是八仙过海,竟然还有刷访问量的 好吧我也被忽悠进来看一看,但是也发现在现有的运行环境上会有一些纰漏,所以做了一些修正 首先给出网上的代码: 这个不算特别坑吧,还有一个调用urllib2的,真的是调试错误就要半天,果断放弃,现在用req 阅读全文
posted @ 2018-08-24 16:54 星涅爱别离 阅读(867) 评论(0) 推荐(1) 编辑