摘要: 挖掘建模根据挖掘目标和数据形式可建立:分类与预测、聚类分析、关联规则、时序模式、偏差检测等模型 1.分类与预测 分类与预测是预测问题的两种主要类型,分类主要是:预测分类标号(离散属性);预测主要是:建立连续值函数模型,预测给定自变量对应的因变量的值。 1.1 实现过程 (1)分类 分类是构造一个分类 阅读全文
posted @ 2018-01-21 23:25 Nice1949 阅读(17734) 评论(2) 推荐(2) 编辑
摘要: 折线图 阅读全文
posted @ 2018-01-20 00:49 Nice1949 阅读(243) 评论(0) 推荐(0) 编辑
摘要: 1.csv格式数据导入 2.excel格式数据导入 3.MySQL数据导入 阅读全文
posted @ 2018-01-19 23:50 Nice1949 阅读(6040) 评论(0) 推荐(0) 编辑
摘要: 数据预处理主要内容包括:数据清洗、数据集成、数据交换、数据规约 1.数据清洗 1.1缺失值处理 缺失值处理方法:删除记录、数据插补、不处理 常见插补方法: 插值法:拉格朗日插值法、牛顿插值法、Hermite插值法、分段插值法、样条插值法 1.2 异常值处理 异常值是否剔除,需视情况而定,因为异常值可 阅读全文
posted @ 2018-01-18 00:01 Nice1949 阅读(2305) 评论(0) 推荐(0) 编辑
摘要: 1.基本统计特征函数 D.corr(method='Pearson') 返回相关系数矩阵 S1.corr(S2,method='Pearson') 计算2个Series间的相关系数 D.cov() 返回协方差矩阵 S1.cov(S2) 计算2个Series间的协方差 阅读全文
posted @ 2018-01-17 21:31 Nice1949 阅读(2826) 评论(0) 推荐(0) 编辑
摘要: 1.数据质量分析 数据质量分析主要任务:检查原始数据是否存在脏数据。 脏数据: 缺失值 异常值 不一致的值 重复数据及含有特殊符号(如:#、¥、*)的数据 1.1 缺失值分析 数据缺失主要包括:记录的缺失、记录中某个字段信息的缺失。 缺失值产生原因: 有些信息暂时无法获取,获取信息代价太大 部分信息 阅读全文
posted @ 2018-01-16 00:15 Nice1949 阅读(1656) 评论(0) 推荐(0) 编辑
摘要: 1、今天的公式是东方财富通可用的。部分公式其它软件(比如通达信)也是可以用的。但不保证完全通用。其它软件(大智慧、通达信)专用公式正在整理中,后续发给大家。 2、导入公式过程:打开东财>上方分析菜单>公式管理器>用户公式>条件选股>指标条件选股>右键单击>新建公式。。。 3、把相关内容复制进去,保存 阅读全文
posted @ 2018-01-01 22:50 Nice1949 阅读(48211) 评论(0) 推荐(0) 编辑
摘要: CSV文件导入MySQL LOAD DATA INFILE语句允许您从文本文件读取数据,并将文件的数据快速导入数据库的表中。 导入文件操作之前,需要准备以下内容: 一、将要导入文件的数据对应的数据库表。 二、准备好一个CSV文件,其数据与表的列数和每列中的数据类型相匹配。 三、连接到MySQL数据库 阅读全文
posted @ 2018-01-01 16:48 Nice1949 阅读(612) 评论(0) 推荐(0) 编辑
摘要: MySQL允许客户端会话明确获取表锁,以防止其他会话在特定时间段内访问表。客户端会话只能为自己获取或释放表锁。它不能获取或释放其他会话的表锁。 创建一个数据表: LOCK和UNLOCK TABLES语法 表的READ锁具有以下功能: 同时可以通过多个会话获取表的READ锁。此外,其他会话可以从表中读 阅读全文
posted @ 2018-01-01 15:45 Nice1949 阅读(396) 评论(0) 推荐(0) 编辑
摘要: MySQL-数据表 MySQL-CREATE TABLE创建表 要在数据库中创建一个新表,可以使用MySQL CREATE TABLE语句。 MySQL-CREATE TABLE语句中为表定义列 MySQL-CREATE TABLE语句中为表定义列语句: 以上语法中最重要的组成部分是: 1.colu 阅读全文
posted @ 2018-01-01 00:47 Nice1949 阅读(298) 评论(0) 推荐(0) 编辑