摘要:
手动推导 代码: from sklearn.naive_bayes import MultinomialNB from sklearn.feature_extraction.text import CountVectorizer if __name__ == '__main__': # 读取文本构建 阅读全文
摘要:
三张手写推导过程 问:为什么不是求点到直线的垂直举例? 垂直距离会缩小误差,取y轴上的距离会放大误差,提高精度 不好计算 线性回归学习套路 随机产生w参数 把w参数与样本数据代入到误差函数中,求解误差值 误差值与用户指定的误差阙值比较 如果大于用户指定的误差阙值,继续调整w参数(2/3/4步骤) 如 阅读全文
摘要:
经验 + 思维 = 规律 数据 + 算法 = 模型 怎么让规律更准? 1.提高数据量和算法 2.海量数据 3.牛逼算法 数据量决定了模型的高度,算法只是逼近这个高度,大数据是机器学习的基础 阅读全文
摘要:
学习过得技术 HDFS YARN MR HIVE HBASE SPARK SPARK(sparkCore、sparkSql、sparkStreaming) HDFS 数据库管理、 存磁盘 Ha模式(在zookeeper之上) 联邦机制(把大象装进冰箱) split切片 Hbase 列式数据库 半结构 阅读全文