摘要: 今日完成:(1)热门主题知识体系在APP中的数据可视化显示 花费时间:2小时 剩余时间:0 遇到问题:有时webview加载文件失效(已解决) 部分代码截图: 明日将完成:文章浏览内容主题分析以及时长记录 阅读全文
posted @ 2020-05-09 22:09 赵代码 阅读(129) 评论(1) 推荐(1) 编辑
摘要: 本周所花上机时间18小时,代码量共计930行,其中,java代码710行,python代码220行。 本周发表博客:7篇 本周学到的内容有: (1)java进行简单文本关键字提取 (2)机器学习的基本知识入门 阅读全文
posted @ 2020-05-09 17:01 赵代码 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 我们知道机器学习中模型的参数是通过不断减小损失函数loss来进行优化的,这就与线性回归的含义不谋而合,只不过线性回归是通过最小二乘法来最小化误差(的平方)并且寻找最优函数。一想到平方,又不难联系到平方损失函数,平方损失函数相比最小二乘法不过就是多了个 1/n ,即求平均的系数。 假设模型预测值为yi 阅读全文
posted @ 2020-05-09 10:42 赵代码 阅读(686) 评论(1) 推荐(1) 编辑
摘要: 一、模型的评估方法 (1)留出法:顾名思义,就是留出一部分作为测试样本。将已知的数据集分成两个互斥的部分,其中一部分用来训练模型,另一部分用来测试模型,评估其误差,作为泛化误差的估计。 注意:(1) 两个数据集的划分要尽可能保持数据分布的一致性,避免因数据划分过程引入人为的偏差。 (2)数据分割存在 阅读全文
posted @ 2020-05-09 00:00 赵代码 阅读(913) 评论(1) 推荐(1) 编辑