随笔分类 - 机器学习
摘要:0、glibc升级至2.23以及python升级至3.7 https://blog.csdn.net/qq_20989105/article/details/90712139 # glibc 2.23升级https://www.cnblogs.com/goldsunshine/p/12938654.
阅读全文
摘要:可以看该博客:https://www.cnblogs.com/aijianiula/p/4339960.html 1、知识点 2、代码案例 3、算法流程
阅读全文
摘要:1、知识点 """ 推荐系统 1、相似度计算: 1、欧几里德距离 2、皮尔逊相关系数 3、Cosin距离 2、推荐相似度选择: 1、固定数量的邻居 2、基于相似度门槛的邻居 3、基于用户的协同过滤:根据用户和其他用户之间的相关系数值,选择值越小的用户数据,并和该用户比较,推荐物品 需要解决的问题:1
阅读全文
摘要:代码来源于:https://www.cnblogs.com/huangyc/p/10327209.html ,本人只是简介学习 1、 贝叶斯.py import numpy as np from word_utils import * class NaiveBayesBase(object): de
阅读全文
摘要:1、知识点 2、代码 3、目标函数 4、优化目标
阅读全文
摘要:知识点: 代码: 轮廓系数:
阅读全文
摘要:# coding=utf-8 from sklearn.datasets import load_iris, fetch_20newsgroups, load_boston from sklearn.model_selection import train_test_split, GridSearchCV from sklearn.neighbors import KNeighborsClas...
阅读全文
摘要:# coding = utf-8 from sklearn import datasets from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split ''' 算法是核心,数据和计算是基础 定位: 1、分析数据 2、分析业务 3、应用常见算法进行对比...
阅读全文
摘要:# coding=utf-8 from sklearn.preprocessing import MinMaxScaler from sklearn.preprocessing import StandardScaler from sklearn.preprocessing import Imputer import numpy as np ''' 特征预处理:通过特定的统计方法,将数据转换成...
阅读全文
摘要:# coding = utf-8 from sklearn.feature_selection import VarianceThreshold from sklearn.decomposition import PCA ''' 数据降维:特征的数量减少(即columns减少) 1、特征选择原因:
阅读全文
摘要:# coding=utf-8 from sklearn.feature_extraction.text import CountVectorizer from sklearn.feature_extraction.dict_vectorizer import DictVectorizer from sklearn.feature_extraction.text import TfidfVecto...
阅读全文