上一页 1 2 3 4 5 6 7 8 ··· 15 下一页
摘要: 今日完成:(1)热门主题知识体系在APP中的数据可视化显示 花费时间:2小时 剩余时间:0 遇到问题:有时webview加载文件失效(已解决) 部分代码截图: 明日将完成:文章浏览内容主题分析以及时长记录 阅读全文
posted @ 2020-05-09 22:09 赵代码 阅读(129) 评论(1) 推荐(1) 编辑
摘要: 本周所花上机时间18小时,代码量共计930行,其中,java代码710行,python代码220行。 本周发表博客:7篇 本周学到的内容有: (1)java进行简单文本关键字提取 (2)机器学习的基本知识入门 阅读全文
posted @ 2020-05-09 17:01 赵代码 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 我们知道机器学习中模型的参数是通过不断减小损失函数loss来进行优化的,这就与线性回归的含义不谋而合,只不过线性回归是通过最小二乘法来最小化误差(的平方)并且寻找最优函数。一想到平方,又不难联系到平方损失函数,平方损失函数相比最小二乘法不过就是多了个 1/n ,即求平均的系数。 假设模型预测值为yi 阅读全文
posted @ 2020-05-09 10:42 赵代码 阅读(686) 评论(1) 推荐(1) 编辑
摘要: 一、模型的评估方法 (1)留出法:顾名思义,就是留出一部分作为测试样本。将已知的数据集分成两个互斥的部分,其中一部分用来训练模型,另一部分用来测试模型,评估其误差,作为泛化误差的估计。 注意:(1) 两个数据集的划分要尽可能保持数据分布的一致性,避免因数据划分过程引入人为的偏差。 (2)数据分割存在 阅读全文
posted @ 2020-05-09 00:00 赵代码 阅读(913) 评论(1) 推荐(1) 编辑
摘要: 今日完成: (1)计算机类专业热门领域爬取与分析 (2)部分热点主题知识体系可视化 花费时间:2小时 剩余时间:0 遇到问题:无 部分代码截图: 明日将完成:APP对接可视化结果 阅读全文
posted @ 2020-05-08 22:16 赵代码 阅读(122) 评论(1) 推荐(1) 编辑
摘要: 最近项目用到了某专业热门学科的知识网统计分析,先总结一下热门主题的分析流程: 1.根据权威论文期刊网站的文章发表情况,统计某学科/专业的热门主题 2.解析该网站的html代码,从中获取数据 3.首先对热门主题进行拆解分词,得到一个列表 4.统计词频并去重 5.对得到的词频字典进行两两键值的文本相似度 阅读全文
posted @ 2020-05-08 17:00 赵代码 阅读(599) 评论(1) 推荐(1) 编辑
摘要: 本篇针对以下几个问题进行总结: 01.了解机器学习的基本概念,能说清楚几个和空间相关的概念。从该角度解释机器学习的实质。 02.经验风险和结构风险有何不同? 03.为什么要引入正则项?和经验风险、结构风险有何关系? 04.说明损失函数的意义。并列出几个常见的损失函数,说明其异同。并去了解常见的算法分 阅读全文
posted @ 2020-05-05 21:29 赵代码 阅读(670) 评论(1) 推荐(1) 编辑
摘要: 由于在阿里的淘宝商品直播识别大赛中提交结果需要用到docker,以前也没有用过。正好阿里提供了docker的新人赛,借此机会学习一下。 既然学习docker,首先就要了解docker是什么: Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到 阅读全文
posted @ 2020-05-03 21:36 赵代码 阅读(1307) 评论(2) 推荐(1) 编辑
摘要: 本周所花上机时间27小时,代码量共计2300行,其中,java代码1920行,python代码380行。 本周发表博客:1篇 本周学到的内容有: (1)Android网络数据缓存与持久化 (2)DBN实现肝脏图像的粗提取 阅读全文
posted @ 2020-05-02 16:58 赵代码 阅读(104) 评论(0) 推荐(0) 编辑
摘要: 巴比伦塔的失败主要是因为交流不畅,语言不通使得复杂的工程在交流模块变得更加的复杂,过度的交流影响了建筑的效率以及概念的完整性。软件产品也是一样的,一个软件产品的复杂度并不比巴比伦塔低,从分析到设计到开发到测试,整个流程下来,完全可以说软件产品就是一个小型的巴比伦塔(建筑工程),所谓软件工程的工程二字 阅读全文
posted @ 2020-04-30 17:12 赵代码 阅读(93) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 15 下一页