摘要: 一、产生原因too many open files是Linux系统中常见的错误,从字面意思上看就是说程序打开的文件数过多,不过这里的files不单是文件的意思,也包括打开的通讯链接(比如socket),正在监听的端口等等,所以有时候也可以叫做句柄(handle),这个错误通常也可以叫做句柄数超出系统 阅读全文
posted @ 2020-09-08 16:57 nike_ha 阅读(233) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/Dreamer-1/p/6076440.html 执行计划动作说明 表访问的几种方式:(非全部) TABLE ACCESS FULL(全表扫描) TABLE ACCESS BY ROWID(通过ROWID的表存取) TABLE ACCESS BY IN 阅读全文
posted @ 2020-09-08 16:56 nike_ha 阅读(147) 评论(0) 推荐(0) 编辑
摘要: 1.数据清洗 详细看:https://www.cnblogs.com/sss-justdDoIt/p/13633508.html 2.数据归一化 详细看:https://www.cnblogs.com/sss-justdDoIt/p/13633536.html 3.模型选择 详细看:https:// 阅读全文
posted @ 2020-09-08 16:55 nike_ha 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 文本分类常用算法比较 本文对文本分类中的常用算法进行了小结,比较它们之间的优劣,为算法的选择提供依据。 一、决策树(Decision Trees) 优点: 1、决策树易于理解和解释.人们在通过解释后都有能力去理解决策树所表达的意义。 2、对于决策树,数据的准备往往是简单或者是不必要的.其他的技术往往 阅读全文
posted @ 2020-09-08 16:54 nike_ha 阅读(917) 评论(0) 推荐(0) 编辑
摘要: 预处理阶段 预处理阶段主要做两件事情: 一是将数据导入处理工具。通常来说,建议使用数据库,单机跑数搭建MySQL环境即可。如果数据量大(千万级以上),可以使用文本文件存储+Python操作的方式。 二是看数据。这里包含两个部分:一是看元数据,包括字段解释、数据来源、代码表等等一切描述数据的信息;二是 阅读全文
posted @ 2020-09-08 16:47 nike_ha 阅读(756) 评论(0) 推荐(0) 编辑
摘要: 数据归一化和标准化 数据标准化/归一化normalization 转自:数据标准化/归一化normalization 这里主要讲连续型特征归一化的常用方法。离散参考[数据预处理:独热编码(One-Hot Encoding)]。 基础知识参考: [均值、方差与协方差矩阵 ] [矩阵论:向量范数和矩阵范 阅读全文
posted @ 2020-09-08 16:46 nike_ha 阅读(837) 评论(0) 推荐(0) 编辑
摘要: 登录:ftp ip port 然后根据提示登录 批量下载所有文件(不是目录) mget * 单个下载文件 get 文件名 下载后的文件位置是你切入到ftp的目录 exit 退出ftp cd 进入目录cd .. 返回上级目录dir 显示目录 阅读全文
posted @ 2020-01-21 14:39 nike_ha 阅读(146) 评论(0) 推荐(0) 编辑
摘要: https://www.jianshu.com/p/280c0f75a217 阿里仓库地址 <mirrors> <mirror> <id>nexus-aliyun</id> <mirrorOf>*</mirrorOf> <name>Nexus aliyun</name> <url>http://ma 阅读全文
posted @ 2020-01-10 16:20 nike_ha 阅读(200) 评论(0) 推荐(0) 编辑
摘要: https://www.w3cways.com/2328.html accounts.json不是放到sourceTree的安装目录里面,按文章的路径去找。即可。。。 阅读全文
posted @ 2020-01-07 14:59 nike_ha 阅读(1144) 评论(0) 推荐(0) 编辑
摘要: Hadoop Hadoop里面包括几个组件HDFS、MapReduce和YARN,HDFS是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面,MapReduce是对数据进行处理计算的,它有个特点就是不管多大的数据只要给它时间它就能把数据跑完,但是时间可能不是很快所以它叫数据的批处理。 YAR 阅读全文
posted @ 2020-01-03 21:04 nike_ha 阅读(239) 评论(0) 推荐(0) 编辑