08 2018 档案

摘要:# -*- coding: utf-8 -*-"""Created on Sat Aug 18 11:08:38 2018@author: acadsoc"""import pandas as pdimport numpy as npimport matplotlibimport matplotli 阅读全文
posted @ 2018-08-25 19:02 蘭亭客 阅读(8059) 评论(1) 推荐(0) 编辑
摘要:# -*- coding: utf-8 -*-"""Created on Sat Aug 18 16:23:17 2018@author: acadsoc"""import scipyimport numpy as npimport pandas as pdimport matplotlibimpo 阅读全文
posted @ 2018-08-25 18:57 蘭亭客 阅读(12104) 评论(0) 推荐(0) 编辑
摘要:很多参数估计问题均采用似然函数作为目标函数,当训练数据足够多时,可以不断提高模型精度,但是以提高模型复杂度为代价的,同时带来一个机器学习中非常普遍的问题——过拟合。所以,模型选择问题在模型复杂度与模型对数据集描述能力(即似然函数)之间寻求最佳平衡。 人们提出许多信息准则,通过加入模型复杂度的惩罚项来 阅读全文
posted @ 2018-08-25 11:22 蘭亭客 阅读(4388) 评论(3) 推荐(1) 编辑
摘要:之前在 SPSS 中的回归分析算法中发现,在它里面实现的算法有 Enter 和 Stepwise 两种。Enter 很容易理解,就是将所有选定的自变量一起放入模型中,直接去计算包含所有自变量的整个模型能够解释多少因变量中的变异,以及各个自变量单独的贡献有多少。但对 Stepwise regressi 阅读全文
posted @ 2018-08-25 10:04 蘭亭客 阅读(1381) 评论(0) 推荐(0) 编辑
摘要:转子:https://www.cnblogs.com/yangjig/p/6014198.html 和 https://blog.csdn.net/u010956473/article/details/74087608 曾经使用了两年多的Vim,手册也翻过一遍。虽然现在不怎么用vim了,曾经的笔记还 阅读全文
posted @ 2018-08-16 17:10 蘭亭客 阅读(622) 评论(0) 推荐(0) 编辑
摘要:建议:如果只是处理(小)数据的,用R。结果更可靠,速度可以接受,上手方便,多有现成的命令、程序可以用。要自己搞个算法、处理大数据、计算量大的,用python。开发效率高,一切尽在掌握。 概述 在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Data 阅读全文
posted @ 2018-08-09 14:38 蘭亭客 阅读(653) 评论(0) 推荐(0) 编辑
摘要:当给模型增加自变量时,复决定系数也随之逐步增大,当自变量足够多时总会得到模型拟合良好,而实际却可能并非如此。于是考虑对R2进行调整,记为Ra2,称调整后复决定系数。R2=SSR/SST=1-SSE/SSTRa2=1-(SSE/dfE)/(SST/dfT) 即: Ra2 = 1- (SSE/(n-p- 阅读全文
posted @ 2018-08-08 17:16 蘭亭客 阅读(6816) 评论(0) 推荐(0) 编辑
摘要:1.C# 调用python 本质上是使用命令行运行python 1.1 C# 使用命令行 program.cs 代码运行结果 调用run_cmd相当于执行了cmd命令,所以就有了使用命令行运行python脚本的方式 1.2. C# 调用 python3脚本 假设C盘根目录下有如下脚本 test1.p 阅读全文
posted @ 2018-08-04 12:44 蘭亭客 阅读(5897) 评论(0) 推荐(2) 编辑

点击右上角即可分享
微信分享提示