09 2018 档案

摘要:关于熵这篇文章比较全 学习的前提了解 数学期望(mean)(或均值,亦简称期望) 是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一。它反映随机变量平均取值的大小。 熵是一种自信息 熵越大, 它的不确定性越大 信息熵:每个信息量的数学期望H(x)= E(log(1/p)),就是其概率 阅读全文
posted @ 2018-09-29 10:19 星涅爱别离 阅读(438) 评论(0) 推荐(0) 编辑
摘要:但是我们也发现每一次登陆都要输入密码和账户,还要验证,这也实在是太麻烦了,所以可以通过cookies,这就是我们常说的那些记住当前网址的密码 关于上面的那个爬虫,爬出来的其实是验证码的图片,还需要手动打开然后识别图片里面的数字再手动输入,这个其实也是很麻烦的 这里先给出思路以后验证(如果还记得的呼哈 阅读全文
posted @ 2018-09-25 23:06 星涅爱别离 阅读(132) 评论(0) 推荐(0) 编辑
摘要:2018.09.25 关于re.match()和re.search()的一些使用说明,主要要注意的是match的话是必须一开始就要从头匹配上,而search的话可以只要中间有一段匹配上就行了 注意一下 print(re.match('super','superstition').span()) pr 阅读全文
posted @ 2018-09-25 22:34 星涅爱别离 阅读(197) 评论(0) 推荐(0) 编辑
摘要:css中 身份证 id对应# 衣服 class对应 . 图片 pyquery。。。as pq html= request.get(url=''.....'') doc=pq(html) doc("#dq_list > li").items() tems()拿到所有子元素 for item in it 阅读全文
posted @ 2018-09-24 22:52 星涅爱别离 阅读(267) 评论(0) 推荐(0) 编辑
摘要:html的宗旨: <标签 属性=”属性的值“></标签> 只是对于文本的一种解释划分吧 dom的宗旨: 就是一个大数组,处理方便,效率低 xml <node attr=value>...</node> html是它的子集,树结构 主要注意节点关系 json 类似xml,对JavaScript友好 m 阅读全文
posted @ 2018-09-22 16:37 星涅爱别离 阅读(157) 评论(0) 推荐(0) 编辑
摘要:和廖雪峰大神的教程学了几遍后,还是出现了许多不足,于是就做一些回顾,列出一些python的细节问题,有一些就提一下,如果发现不清楚的话 还请移步https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e54 阅读全文
posted @ 2018-09-22 16:35 星涅爱别离 阅读(123) 评论(0) 推荐(0) 编辑
摘要:两个随机变量的独立性表示两个变量X与Y是否有关系(贝叶斯可证),但是关系的强弱(mutual dependence)是无法表示的,为此我们引入了互信息。 其中 p(x,y) 是 X 和 Y 的联合概率分布函数,而p(x)和p(y)分别是 X 和 Y 的边缘概率分布函数。 在连续随机变量的情形下,求和 阅读全文
posted @ 2018-09-21 22:41 星涅爱别离 阅读(2949) 评论(0) 推荐(0) 编辑
摘要:当我们解析网页后,往往面对繁杂的源代码而无从下手,有时候明明知道我们想要的数据就在里面,可是应该如何把冗余的部分去除而只保留我们想要的那一个部分呢 在这里和大家一起学习一下选择的方法 1、正则表达式 真的是无奈之举的时候才会想到要去正则,因为它除非格式标准,否则每次搜索都要重新的绘制pattern 阅读全文
posted @ 2018-09-14 21:58 星涅爱别离 阅读(318) 评论(0) 推荐(0) 编辑
摘要:一到开学季,校园里面又开始散发着爱情的酸腐,与其一个人在寝室默默地哭泣,不如上网看看比外面更漂亮的妹子! 嗯,想到这,我忍不住打开了http://jandan.net/ooxx,捏着手中的精灵球,好,今天的少女图鉴就从煎蛋网开始吧!!!冲鸭 打开网页,目标定格在了最后一页 先用f12看一下 发现了, 阅读全文
posted @ 2018-09-04 16:40 星涅爱别离 阅读(547) 评论(0) 推荐(0) 编辑
摘要:https://www.w3cschool.cn/sql/anioefpk.html 阅读全文
posted @ 2018-09-04 12:28 星涅爱别离 阅读(101) 评论(0) 推荐(0) 编辑
摘要:开学啦,让我们来看看豆瓣上有什么好书吧 首先当然是很正经地访问一下网页啦 网站网址是https://book.douban.com/top250?start=0 那么我们所需要的内容就是图片旁边的信息了,那就先让虫子爬过去吧,上吧小虫虫!!! 好了,get到源代码了,再来看看自己需要的信息在哪里 就 阅读全文
posted @ 2018-09-03 11:01 星涅爱别离 阅读(881) 评论(2) 推荐(0) 编辑

点击右上角即可分享
微信分享提示