摘要:
雅思分为四块:听力,阅读,写作,口语。 最容易提高的是听力和阅读,最难提高的是写作和口语。 首先是阅读。阅读这种东西,词汇一边积累,但是题目照做。 雅思的题目是按顺序来的,这点非常的友好,方便我们定位文中关键句。 首先,把剑7做一遍,每个section掐表。要求:最难的一篇不超过20min,最简单的 阅读全文
摘要:
1. 定义、研究对象、方法 2. 监督学习 3. 模型选择:正则化、交叉验证、泛化能力、生成模型、判别模型 4. 分类问题、标注问题、回归问题 对索引内容的回忆(不记得的内容标为红色): 1. 奥卡姆剃刀(Occam's razor):在复杂的模型和简单的模型前,选择简单的模型。能用一个变量做的事情 阅读全文
摘要:
阅读全文
摘要:
一、数据库中的去重操作(删除数据库中重复记录的SQL语句)主要有三种方法 (1)、rowid方法 (2)、group by 方法 (3)、distinct方法 1、用rowid方法 根据Oracle带的rowid属性,可以进行判断是否存在重复语句; (1)、查出表1和表2中name相同的数据 Sel 阅读全文
摘要:
1.选择优化的数据类型 几个原则:更小的通常更好 简单就好 尽量避免NULL 选择数据类型时,先选合适的大类型:数字,字符串,时间等。下一步选择具体类型。 具体类型包括: 1.1 整数类型 如果存储整数,可以使用以下几种数据类型: TINYINT, SMALLINT, MEDIUMINT, INT, 阅读全文
摘要:
1.行为事件分析 场景: 研究某行为事件的发生对企业组织价值的影响以及影响的程度。 举例: 在日常工作中,运营、市场、产品、数据分析师根据实际工作情况而关注不同的事件指标。如最近三个月来自哪个渠道的用户注册量最高?变化趋势如何?各时段的人均充值金额是分别多少?上周来自北京发生过购买行为的独立用户数, 阅读全文
摘要:
前两天在破船(K650D)上试图搭建Hadoop伪分布式失败(一直报3.1.2 hadoop-master: ssh: Could not resolve hostname hadoop-master: Name or service not known),现在打算在Ubuntu16.04上用Doc 阅读全文
摘要:
1 入门 1.Hive官网地址 http://hive.apache.org/ 2.文档查看地址 https://cwiki.apache.org/confluence/display/Hive/GettingStarted 3.下载地址 http://archive.apache.org/dist 阅读全文
摘要:
描述计算机网络的模型有很多,这门课选择TCP/IP 五层模型。本课程也会讲其他计网模型,七层的OSI模型。 每层的协议都会封装好上层的协议,从而实现数据传输。 The TCP/IP Five-Layer Network Model 物理层: 物理层表示互连计算机的物理设备。这包括网络电缆的规范和将设 阅读全文
摘要:
要有高性能的MySQL服务,不仅需要设计好的库表结构、好的索引,还需要有好的查询。 也就是说,一个慢查询的出现,可以从服务器、库表结构、索引、查询语句等方面着手。 对查询进行性能剖析有两种方式,一种是剖析服务器负载,另一种是剖析单条查询。 1.剖析服务器负载 1.1捕获慢查询 使用慢查询日志。慢查询 阅读全文
摘要:
这个分类器是大三下学期写的,那时在找数据挖掘的暑期实习,朋友向我求助说有个数据挖掘作业他不会写,我就当作做一个项目,把这个作业做一下。 前前后后花了我两个多星期,最后完成的时候十分感动。 阅读全文