07 2019 档案

销售分析第二天:线性回归
摘要:y = groupall.values[:, 2:] x = range(np.shape(y)[1]) plt.plot(x, y[0], "b.") x2 = np.array(x).reshape(-1,1) y2 = np.array(y[0]).reshape(-1,1) plt.plot(x2, y2, "r.") sgd_reg2 = SGDRegressor(n_iter_n... 阅读全文

posted @ 2019-07-27 22:47 张叫兽的技术研究院 阅读(173) 评论(0) 推荐(0) 编辑

销售分析最后几天
摘要:第三天 1. csv文件的读取确实要比excel文件快很多; 2. 在panython3中的range就是python2中的xrange; 第四天 3. 发现300天的拟合出现了严重的准度问题,都出现负值了,首先我把负值都处理为0,情况仍然,然后,开始我怀疑是自己的predict超出了fit范围导致,但是发现predict的x即使和fit的相同,仍然y_predict非常离谱;接着,于是我怀疑是不... 阅读全文

posted @ 2019-07-27 22:36 张叫兽的技术研究院 阅读(162) 评论(0) 推荐(0) 编辑

深度神经网络
摘要:隐藏层(hidden layer) 为什么叫隐藏层?因为是黑盒角色;输入层输入到"黑盒",将会得到进行运算,最后数据到输出层。隐藏层是深度学习一个基本概念。 输入层是原始数据样本,注意每个原始样本的滑窗范围(也叫感受视野,local receptive fields,也被称之为卷积核,还常被称之为filter,和"深度"意思一致)对应着隐藏层一个节点,这个映射过程是通过将输入数据*权重... 阅读全文

posted @ 2019-07-27 21:28 张叫兽的技术研究院 阅读(369) 评论(0) 推荐(0) 编辑

Python访问数据库
摘要:之前总是报错,说是Connection Already Close;后来才发现是因为写法的问题;在writeToDB的函数中,执行完毕后,将会执行final里面的关闭链接; 但是,其实访问并没有完事,在writeToDB外围还有一层循环,后续还是会继续访问数据库,但是此时链接已经关闭,于是导致了这个 阅读全文

posted @ 2019-07-27 20:55 张叫兽的技术研究院 阅读(226) 评论(0) 推荐(0) 编辑

关于线性回归的矩阵格式
摘要:直接上代码: x [[1] [2] [3] [4]] y [[2] [4] [6] [8]] line.coef_: [[2.]] line.intercept_: [0.] 完美,这是非常标准的线性回归的参数形式;看到coef和intercept也是和我们预期是相符的。 下面的是转置之后的数据处理 阅读全文

posted @ 2019-07-13 16:14 张叫兽的技术研究院 阅读(856) 评论(0) 推荐(0) 编辑

vs code使用
摘要:1. 整体字代替大小 ctrl +:增大窗口字体ctrl -:减小窗口字体 2. vs code显示图形 vs code 显示图像注意需要调用plt.show(),这个和jppyter不太一样,前者应该对于plot做了优化,可以不需要显式的声明。对于sns等画图package,在build完画面之后 阅读全文

posted @ 2019-07-13 15:57 张叫兽的技术研究院 阅读(1039) 评论(0) 推荐(0) 编辑

VS Code中配置python版本以及Python多版本
摘要:VS Code中配置python版本VS Code十分方便配置python的版本;可以选在在本地setting.json或者全局setting.json文件中配置:python.pythonPath在全局配置,通过command palette中敲入settings,可以看到有一个Global Se 阅读全文

posted @ 2019-07-13 15:53 张叫兽的技术研究院 阅读(13877) 评论(0) 推荐(0) 编辑

计算相关性
摘要:参考: https://www.jianshu.com/p/c83dd487df09 阅读全文

posted @ 2019-07-13 15:52 张叫兽的技术研究院 阅读(326) 评论(0) 推荐(0) 编辑

Tensorflow问题
摘要:TypeError: 'urban' has type str, but expected one of: bytes 在前面添加"b"(例如,b'urban'),或者处理为variableName.encode("utf8") Variable count_var2 already exists, 阅读全文

posted @ 2019-07-13 15:44 张叫兽的技术研究院 阅读(1151) 评论(0) 推荐(0) 编辑

朴素贝叶斯
摘要:其实贝叶斯算法本质是某些特征取特定特征值的情况下,指定特征的概率是多少的算法: P(feature_x=value_0|feature_1=value1,feature_2=value2,feature_3=value3); 算法的实现就是将刚才描述的条件式转化为指定特征为指定特征值的情况下,某个特征的取某个特征值的概率是多大 =>P(feature... 阅读全文

posted @ 2019-07-13 15:37 张叫兽的技术研究院 阅读(276) 评论(0) 推荐(0) 编辑

日志分类以及TFIDF
摘要:TF的概念是Term Frequent,是一个单词出现的频率,是一个局部概念,就是这个单词在指定文件中出现的频率,公式如下: 但是呢,这个TF其实很没有说服力,比如the,a之类的频率很高,但是其实不能实现很好地分类标志,尽管可以在停用词中进行禁用,但是很多单词还是无法全部禁用干净;这个时候就引入了IDF,Inverse Document Frequent,反向文档频率(我称之为区分度公式),... 阅读全文

posted @ 2019-07-13 15:36 张叫兽的技术研究院 阅读(1596) 评论(0) 推荐(0) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示