摘要: 一.在处理pandas表格数据时,有时会遇到这样的问题:按照某一列聚合后,判断另一列是否出现唯一值,比如安泰杯--跨境电商比赛中,某个商人的ID如果出现在两个国家(xx和yy),则要剔除这样的数据,这就需要我们按照商人ID进行groupby,然后判断每个商人所属的国家是否值唯一,不唯一则剔除。 de 阅读全文
posted @ 2019-07-01 22:45 USTC丶ZCC 阅读(1716) 评论(0) 推荐(0) 编辑
摘要: 网上大部分教程都是:创建tensorflow虚拟环境(conda create -n tensorflow python=3.6),然后在虚拟环境中pip install tensorflow,但是每次启动时都要激活虚拟环境(activate tensorflow)! 其实可以不用创建虚拟环境直接安 阅读全文
posted @ 2019-07-01 17:34 USTC丶ZCC 阅读(2454) 评论(1) 推荐(0) 编辑
摘要: 一、Voting 模型融合其实也没有想象的那么高大上,从最简单的Voting说起,这也可以说是一种模型融合。假设对于一个二分类问题,有3个基础模型,那么就采取投票制的方法,投票多者确定为最终的分类。 二、Averaging 对于回归问题,一个简单直接的思路是取平均。稍稍改进的方法是进行加权平均。权值 阅读全文
posted @ 2019-07-01 16:52 USTC丶ZCC 阅读(1002) 评论(0) 推荐(0) 编辑