摘要: SVG画布 HTML 5 提供两种强有力的“画布”:SVG 和 Canvas。 SVG的特点: SVG 绘制的是矢量图,因此对图像进行放大不会失真 基于 XML,可以为每个元素添加 JavaScript 事件处理器 每个图形均视为对象,更改对象的属性,图形也会改变 不适合游戏应用 Canvas特点: 阅读全文
posted @ 2017-12-22 16:43 Hyacinth-Yuan 阅读(3105) 评论(0) 推荐(0) 编辑
摘要: 本系列参考学习自http://www.ourd3js.com 非常感谢博主的分享! 使用D3 在网页中使用D3有两种方法: 1. 下载D3.js文件后本地引用 下载地址 https://github.com/mbostock/d3/releases/download/v3.4.8/d3.zip 2. 阅读全文
posted @ 2017-12-22 16:42 Hyacinth-Yuan 阅读(767) 评论(0) 推荐(0) 编辑
摘要: 欧式距离 欧式距离想必很熟悉了,就是两个特征向量长度平方和的平方根嘛 优势:简单直观 劣势:若某些特征比其他特征值大很多,精度就会比较差。此外,若有很多特征值为0,也就是所谓的稀疏矩阵,结果也不准确。总之,稳定性不是很好 曼哈顿距离 曼哈顿距离是两个特征在标准坐标系中绝对轴距之和(没有使用平方距离) 阅读全文
posted @ 2017-12-10 13:54 Hyacinth-Yuan 阅读(1733) 评论(0) 推荐(1) 编辑
摘要: 爬取代理 Python3中urllib详细使用方法(header,代理,超时,认证,异常处理),详见https://www.cnblogs.com/ifso/p/4707135.html 验证代理 第50行报错,TypeError: cannot use a string pattern on a 阅读全文
posted @ 2017-12-08 15:48 Hyacinth-Yuan 阅读(614) 评论(0) 推荐(0) 编辑
摘要: 爬取更多的items,例如名字,主演,播放次数,电影海报,并进行多页爬取。 items.py youkuMoiveSpider.py pipelines.py setting.py 当然,过程中还是出了不少bug,一部分是不同文件间的类名拼写错误(哎呀,细心细心啊) 一部分是因为python的语法不 阅读全文
posted @ 2017-12-08 15:46 Hyacinth-Yuan 阅读(1244) 评论(2) 推荐(0) 编辑
摘要: x小组实训中,要用到爬虫的地方。从今天起开始学习。 首先,介绍几篇入门的好文章 爬虫入门系列(一):快速理解HTTP协议 爬虫入门系列(二):优雅的HTTP库requests 爬虫入门系列(三):用 requests 构建知乎 API 爬虫入门系列(四):HTML文本解析库BeautifulSoup 阅读全文
posted @ 2017-12-06 20:47 Hyacinth-Yuan 阅读(1145) 评论(0) 推荐(0) 编辑
摘要: 之前在kaggle上做了关于房价预测的比赛,现整理如下。 解决问题的大概步骤是: 1、通过画图查看目标变量SalePrice是否偏分布,若是,则进行log(x+1)变换。并查看数值变量,若偏度大于0.75,也做log(x+1)变换 2、缺失值处理。分类变量NA NA值赋值为0,数值变量中的NA赋值为 阅读全文
posted @ 2017-12-05 09:07 Hyacinth-Yuan 阅读(821) 评论(0) 推荐(0) 编辑
摘要: 第一章:评分卡的开发过程 标准评分卡 信用评分卡类型: 两种类型的开发过程方案基本相同,但有两个主要差别: 通常,行为评分卡比申请评分卡更精确。因为行为评分卡在对账户状态进行预测时基于更多的数据要素(交易产生的) 拒绝演绎技术只在申请评分卡的开发过程中使用。 评分卡的优势:表格样式,易于理解;总信用 阅读全文
posted @ 2017-12-04 10:41 Hyacinth-Yuan 阅读(1046) 评论(0) 推荐(0) 编辑
摘要: 数据来源于:https://data.cityofnewyork.us/Education/2005-2010-Graduation-Outcomes-By-Borough/avir-tzek 数据理解 原数据其实是有点乱的,第一列Demographic可以说是一些标签吧,有English Lang 阅读全文
posted @ 2017-12-04 10:16 Hyacinth-Yuan 阅读(444) 评论(0) 推荐(0) 编辑
摘要: shiny是一个R语言中的网络应用程序框架,可以将你的数据分析变成交互式的网络应用(web apps),简单又实用。 基本用法 一个shiny应用可以分为两部分:前端和后端,其实所有的shiny应用都是基于以下的模版: 其中,fluidPage中主要有两部分:输入函数,和输出函数 输入函数 输入函数 阅读全文
posted @ 2017-12-03 21:54 Hyacinth-Yuan 阅读(3934) 评论(0) 推荐(1) 编辑