摘要: 定义: Hawkins给出的离群点的本质性定义:离群点是数据集中偏离大部分数据的数据,由于偏离其它数据太多,使人怀疑这些数据的偏离并非由随机因素产生,而是产生于完全不同的机制。 大致分类: 一例分析步骤: 常用离群点检测方法优劣分析: 参考: 离群点检测技术在教育教学中的应用: http://kns 阅读全文
posted @ 2019-02-07 11:45 IMWU 阅读(3833) 评论(0) 推荐(0) 编辑
摘要: 示例 org.jvnet.localizer 只适用于 Java.net资源库 pom.xml 未声明,将报错 声明Java.net储存库 告诉 Maven 来获得 Java.net 的依赖,你需要声明远程仓库在 pom.xml 文件这样: pom.xml 现在,Maven的依赖库查询顺序更改为: 阅读全文
posted @ 2018-10-20 17:11 IMWU 阅读(175) 评论(0) 推荐(0) 编辑
摘要: Maven的本地库 : Maven的本地资源库是用来存储所有项目的依赖关系(插件jar和其他文件,这些文件被Maven下载)到本地文件夹。很简单,当你建立一个Maven项目,所有相关文件将被存储在你的Maven本地仓库。 1. 更新Maven的本地库 : 找到 {M2_HOME}\conf\sett 阅读全文
posted @ 2018-10-20 17:08 IMWU 阅读(1076) 评论(0) 推荐(0) 编辑
摘要: 1.解压序列赋值给多个变量 只要变量的数量和元素的个数相同就可以如此简单的解压赋值 实际上这种解压赋值方法可以用在任何可迭代对象上面() 阅读全文
posted @ 2018-09-08 13:17 IMWU 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 能for...in...的为可迭代对象 迭代器是⼀个可以记住遍历的位置的对象。迭代器对象从集合的第⼀个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。 判断方法: isinstance() 迭代器定义方法: 生成器: 生成器是一种简单有效的创建迭代器的工具: 1.自动创建__ite 阅读全文
posted @ 2018-09-07 21:13 IMWU 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 昨天帮人看了个bug 用python2爬取这个网站(view-source:http://op1.win007.com/Companyhistory.aspx?type=1&id=115&company=%CD%FE%C1%AE%CF%A3%B6%FB(%D3%A2%B9%FA)&matchdate 阅读全文
posted @ 2018-08-26 09:41 IMWU 阅读(644) 评论(0) 推荐(0) 编辑
摘要: 1.预登陆 首先手工登陆一次,通过抓包工具或者浏览器控制台分析登陆过程 2.模拟登陆 通常来说简单的爬虫用requests就能搞定 但是这个登陆过程,几次跳转,技术不够,没搞定 尝试使用selenium模拟登陆 selenium:本来用于自动化测试,由于其几乎完全模拟浏览器操作,所以也常用于爬虫 导 阅读全文
posted @ 2018-08-25 14:17 IMWU 阅读(802) 评论(0) 推荐(0) 编辑
摘要: #open()返回文件对象,open(filename,mode): mode: #以文本打开 'r':读取文件 'w':写入文件(同名文件将会删除) 'a':追加文件 'r+':打开并写入文件 #以二进制打开,任何不包含文本的文件(文本模式下会修改行结束符,会损坏非ascll文件) 'b':二进制 阅读全文
posted @ 2018-08-21 16:10 IMWU 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 格式化输出: print() write() sys.stdout 值转化成字符串: repr(): 转化为供解释器读取的形式 str(): 转换为供人读取的形式 #将字符串输出到一列,并向左侧填充空格以右对齐,同理还有str.ljust,str.center() str.rjust() #向数值的 阅读全文
posted @ 2018-08-21 15:25 IMWU 阅读(175) 评论(0) 推荐(0) 编辑