2020年1月23日
摘要: 一、决策树与随机森林 1、信息论基础 香农:奠定了现代信息论基础,定义信息的单位比特。 32支球队,预测世界杯冠军,不知道任何信息的情况下,使用二分法最少需要猜5次。(log32=5) 5 = - (1/32log1/32 + 1/32log1/32 + ...+ 1/32log1/32) 而在开放 阅读全文
posted @ 2020-01-23 00:25 三分天涯 阅读(2717) 评论(0) 推荐(0) 编辑
  2019年12月4日
摘要: 一、机器学习基础 算法是核心,数据和计算是基础。 数据类型 离散型数据:记录不同类别个体的数目所得到的数据,又称为计数数据,全部是整数,不能再细分,也不能进一步提高精度。 连续型数据:变量可以在某个范围内取任意数,即变量的取值可以是连续的,通常是非整数。 离散型是区间内不可分,连续型是区间内可分。 阅读全文
posted @ 2019-12-04 21:45 三分天涯 阅读(807) 评论(0) 推荐(0) 编辑
  2019年11月12日
摘要: 一、机器学习 图灵测试 机器学习领域:自然语言处理、图像识别、传统预测 机器学习库和框架:Scikit-learn、TensorFlow、Caffe、Keras 定义:机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测。 目的:让机器学习程序替换手动的步骤,减少企业的成本也提高 阅读全文
posted @ 2019-11-12 17:25 三分天涯 阅读(354) 评论(0) 推荐(0) 编辑
  2019年10月26日
摘要: 三、数据提取方法 1、基本概念 数据提取就是从响应中获取我们想要的的数据的过程 数据分类: 非结构化数据:HTML等 处理方法:正则表达式、xpath 结构化数据:json、xml等 处理方法:转化为Python数据类型 2、正则表达式复习 . 匹配 \n: In [2]: re.findall(" 阅读全文
posted @ 2019-10-26 16:28 三分天涯 阅读(201) 评论(0) 推荐(0) 编辑
  2019年10月18日
摘要: 一、爬虫基本概念 1、基本概念 首先请问:都说现在是"大数据时代",那数据从何而来? 企业产生的用户数据:百度指数、阿里指数、TBI腾讯浏览指数、新浪微博指数 数据平台购买数据:数据堂、国云数据市场、贵阳大数据交易所 政府/机构公开的数据:中华人民共和国国家统计局数据、世界银行公开数据、联合国数据、 阅读全文
posted @ 2019-10-18 11:40 三分天涯 阅读(406) 评论(0) 推荐(0) 编辑
  2019年10月7日
摘要: 一、数据库简介 传统记录数据的缺点: 不易保存、备份困难、查找不便 文件: ①使用简单,例如python中的open可以打开文件,用read/write对文件进行读写,close关闭文件 ②对于数据容量较大的数据,不能够很好的满足,而且性能较差 ③不易扩展 数据库: ①持久化存储 ②读写速度极高 ③ 阅读全文
posted @ 2019-10-07 21:20 三分天涯 阅读(162) 评论(0) 推荐(0) 编辑
  2019年9月25日
摘要: 一、JavaScript简介 JavaScript是运行在浏览器端的脚本语言,JavaScript主要解决的是前端与用户交互的问题,包括使用交互与数据交互。 JavaScript是浏览器解释执行的,前端脚本语言还有JScript(微软,IE独有),ActionScript( Adobe公司,需要插件 阅读全文
posted @ 2019-09-25 18:26 三分天涯 阅读(221) 评论(0) 推荐(0) 编辑
  2019年8月28日
摘要: 一、圆角、rgba 设置某一个角的圆角,比如设置左上角的圆角: border-top-left-radius:30px 60px; border-top-left-radius: 60px; 同时分别设置四个角: border-radius:30px 60px 120px 150px; 设置四个圆角 阅读全文
posted @ 2019-08-28 00:13 三分天涯 阅读(686) 评论(0) 推荐(0) 编辑
  2019年8月18日
摘要: 一、常用图片格式 图片是网页制作中很重要的素材,图片有不同的格式,每种格式都有自己的特性,了解这些特效,可以方便我们在制作网页时选取适合的图片格式,图片格式及特性如下: 1、psd photoshop的专用格式。优点:完整保存图像的信息,包括未压缩的图像数据、图层、透明等信息,方便图像的编辑。缺点: 阅读全文
posted @ 2019-08-18 00:21 三分天涯 阅读(489) 评论(0) 推荐(0) 编辑
  2019年8月10日
摘要: 1、CSS简介 为了让网页元素的样式更加丰富,也为了让网页的内容和样式能拆分开,CSS由此思想而诞生 CSS是 Cascading Style Sheets 的首字母缩写,意思是层叠样式表 有了CSS,html中大部分表现样式的标签就废弃不用了,html只负责文档的结构和内容,表现形式完全交给CSS 阅读全文
posted @ 2019-08-10 23:58 三分天涯 阅读(232) 评论(0) 推荐(0) 编辑