每日总结

  1. .csv文件放入pychar工程文件,用决策树来完成问题企业的判断

     

     使用pandas读取文件

     

     

     选取目标值与特征值(企业id,买入卖出的数量。Label为有问题企业代码)

     

     

     缺失值处理

     

     数据集划分

     

     字典特征抽取

     

     决策树预估器

     

     模型评估

     

     结果:

     

     

    训练集中有问题企业有:110

    20%划分的数据集,那有问题的企业应该有个45百家吧,差不多应该对。

posted @ 2021-11-02 20:09  chenghaixinag  阅读(81)  评论(0编辑  收藏  举报