摘要: 关于SQL需要掌握: 1、提取特定情况下的数据,比如提取2017年的数据,提取前100个顾客的数据等 2、数据库的增、删、查、改,这些命令都很简单,记住即可 3、数据的分组聚合、如何建立多个表之间的联系,这在处理多维度、多个数据集时很有用 对于以上,需要掌握一些基本的操作,找一些数据集练习一下即可 阅读全文
posted @ 2018-03-13 23:51 歪胡子的日常 阅读(1286) 评论(0) 推荐(0) 编辑
摘要: ###(1)问题一:如何在tensorflow环境下使用spyder 答:在anaconda navigator中environment中搜索tensorflow,安装适合tensorflow的spyder ###(2)问题二:在在tensorflow环境下使用spyder时有些库文件(比如matp 阅读全文
posted @ 2018-03-12 00:12 歪胡子的日常 阅读(2724) 评论(0) 推荐(0) 编辑
摘要: 1、查看.mat文件:load('文件名')即可,其中有这样的语句: load('ex3data1.mat'); % training data stored in arrays X, y m = size(X, 1); 这其中在文件中已经定义了X,所以在程序的内容中X已经有了数据 2、关于~ise 阅读全文
posted @ 2018-03-12 00:12 歪胡子的日常 阅读(593) 评论(0) 推荐(0) 编辑
摘要: 笔记: import pandas as pd 对于csv数据文件,利用pd.read_csv()打开,如train_data=pd.read_csv('') 利用train_data.head()可以查看部分data train_describe()可以得到统计数目,得到平均数、方差等特征(当然是 阅读全文
posted @ 2018-03-10 00:31 歪胡子的日常 阅读(4073) 评论(0) 推荐(0) 编辑
摘要: 数据的获取方式: 1、获取外部的公开数据集, UCI 加州大学欧文分校开放的经典数据集,被很多数据挖掘实验室采用 http://archive.ics.uci.edu/ml/datasets.html 国家数据:数据来源于中国国家统计局,包含了我国经济民生等多个方面的数据。 http://data. 阅读全文
posted @ 2018-03-08 22:40 歪胡子的日常 阅读(2037) 评论(0) 推荐(0) 编辑
摘要: 企业对数据分析师的基础技能需求差别不大,如下: SQL数据库的基本操作,会基本的数据管理 会用Excel/SQL做基本的数据管理 会用脚本语言进行数据分析,Python or R 有获取外部数据的能力,如爬虫 会基本的数据可视化技能,能撰写数据报告 熟悉常用的数据挖掘算法:以回归分析为主 SQL数据 阅读全文
posted @ 2018-03-08 22:39 歪胡子的日常 阅读(372) 评论(0) 推荐(0) 编辑
摘要: 在使用matlab对数据进行拟合时,遇到了一些问题,现记录如下: 1、拟合参数精度不够,导致拟合曲线计算的输出值与原函数值相差较大,比如高斯拟合时峰值位置偏移较大。 这时我们可将拟合的模型保存到工作空间(save xxfit to workspace),在命令窗口中输入‘coeffvalues(xx 阅读全文
posted @ 2018-03-08 10:28 歪胡子的日常 阅读(1343) 评论(0) 推荐(0) 编辑