10 2019 档案

摘要:一.k-means原理 k-means属于无监督学习。 将原始点分成3类 k的取值, 1.需要将样本分成几类,k就取几 2.通过网格搜索自动调节 1.需要将样本分成几类,k就取几 2.通过网格搜索自动调节 中心点计算:所有点的x,y,z取平均(x1+x2+……xn)/n,(y1+y2+yn)/n,( 阅读全文
posted @ 2019-10-31 11:37 荼离伤花 阅读(634) 评论(0) 推荐(0)
摘要:保存成ridge.pkl 加载ridge.pkl 阅读全文
posted @ 2019-10-31 11:09 荼离伤花 阅读(319) 评论(0) 推荐(0)
摘要:一。精确率和召回率 sklearn查看精确率召回率 二。ROC曲线和AUC指标 准确率和召回率在样本不均衡的情况下不能良好的反应模型的好坏。 sklearnAPI 阅读全文
posted @ 2019-10-31 10:59 荼离伤花 阅读(151) 评论(0) 推荐(0)
摘要:一。sklearnAPI 二。预测乳腺癌 阅读全文
posted @ 2019-10-31 10:25 荼离伤花 阅读(614) 评论(0) 推荐(0)
摘要:一。sklearnAPI 正规方程和梯度下降 二。 岭回归-带L2正则化的线性回归 在建立回归方程时加上正则化,解决过拟合问题。 阅读全文
posted @ 2019-10-30 18:09 荼离伤花 阅读(716) 评论(0) 推荐(0)
摘要:一。集成学习 详细参考 https://blog.csdn.net/zwqjoy/article/details/80431496 二。随机森林 -由多个决策树构成的分类器 三。sklearn随机森林 数据准备和预处理与决策树相同 阅读全文
posted @ 2019-10-30 16:32 荼离伤花 阅读(144) 评论(0) 推荐(0)
摘要:一,决策树概念 通过分支进行判断结果,而这些分支就是特征,如果重要的特征在根节点,就能有效的减少决策次数。所以决策树的问题在于如何高效的构建决策树。 二。 信息论 1.信息熵 -代表信息(结果)的不确定性 2.信息增益 当确定某个特征后,信息熵改变的大小(信息熵-条件熵) 三。sklearn决策树 阅读全文
posted @ 2019-10-30 15:50 荼离伤花 阅读(178) 评论(0) 推荐(0)
摘要:一。基本原理 贝叶斯公式 二。在文本分类中的情况 sklearn实现 阅读全文
posted @ 2019-10-30 13:12 荼离伤花 阅读(258) 评论(0) 推荐(0)
摘要:1 from sklearn.datasets import load_iris 2 from sklearn.model_selection import train_test_split #集合划分 3 from sklearn.feature_extraction import DictVectorizer #字典特征抽取 4 from sklearn.feature_extrac... 阅读全文
posted @ 2019-10-30 10:54 荼离伤花 阅读(309) 评论(0) 推荐(0)
摘要:对鸢尾花数据集进行分类并交叉验证 阅读全文
posted @ 2019-10-29 16:45 荼离伤花 阅读(1055) 评论(0) 推荐(0)
摘要:模型保存 模型读取 阅读全文
posted @ 2019-10-25 18:18 荼离伤花 阅读(130) 评论(0) 推荐(0)
摘要:1.卷积神经网络流程 2.准备数据集和权重参数结构 3.定义前向传播函数,反向传播函数 4.进行迭代 通过测试得到精确度99.4% 阅读全文
posted @ 2019-10-25 18:03 荼离伤花 阅读(155) 评论(0) 推荐(0)
摘要:根据分类任务创建神经网络结构(模型) 1.导入数据 2.根据神经网络结构创建数据参数 3.通过前向传播得到预测值,反向传播来优化参数 4.进行迭代并显示结果 通过100次迭代的准确率83% 阅读全文
posted @ 2019-10-25 11:41 荼离伤花 阅读(130) 评论(0) 推荐(0)
摘要:1.下载导入数据集 0-9字符分类 2.设置参数和损失函数,梯度下降,准确率 3.开始运行上述步骤 阅读全文
posted @ 2019-10-25 10:03 荼离伤花 阅读(602) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2019-10-24 16:55 荼离伤花 阅读(122) 评论(0) 推荐(0)
摘要:一。pandas基本介绍 pandas和numpy创建的数据类似,但是会带有名称,默认0,1,2…… 生成数列 生成矩阵(根据numpy矩阵) 生成矩阵(根据字典) 输出矩阵类型,行,列名称,值 获取矩阵值的信息 矩阵翻转 按列索引排序 按某列数据行排序 二。pandas数据选择 根据label选择 阅读全文
posted @ 2019-10-18 20:04 荼离伤花 阅读(140) 评论(0) 推荐(0)
摘要:NumPy是Python的一种开源的数值计算库。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。 1.导入numpy,创建矩阵,查看维数,形状,大小 2.numpy的创建 创建3行 阅读全文
posted @ 2019-10-14 19:40 荼离伤花 阅读(128) 评论(0) 推荐(0)
摘要:关于imread和imwrite的问题 在使用imwirte时发现创建文件失败,于是总结了imread和imwrite路径的形式。 imread中绝对路径间隔符可以为\\和//和/ imwrite中绝对路径间隔符可以为\\和//和/ 结果依然保存图像失败。后来发现了因为我使用了不存在的文件路径作为保 阅读全文
posted @ 2019-10-14 11:32 荼离伤花 阅读(1336) 评论(0) 推荐(0)
摘要:1.通过全局变量方式 mfcDlg.cpp 如果要在1.cpp中使用g_num,需要在mfcDlg.cpp的头文件中声明extern int g_num。1.cpp中要包含mfcDlg.h 2.通过主对话框类的成员变量,在创建线程时传递主对话框类的指针; 3.界面线程间通信。 界面线程创建时,无法传 阅读全文
posted @ 2019-10-09 17:12 荼离伤花 阅读(1558) 评论(0) 推荐(0)
摘要:一。创建线程的三种方式 1.CreateThread (windows中vc++) 2.AfxBeginThread(MFC) 3._beginthread 二。子线程使用主线程参数 1.子线程对应于一个普通函数,不能被简单的声明成主对话框类的成员函数,因此不能使用主对话框(主线程)的参数,需要在创 阅读全文
posted @ 2019-10-08 18:52 荼离伤花 阅读(6929) 评论(0) 推荐(0)