上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 28 下一页

2018年12月11日

pandas 处理文本数据

摘要: 常规的字符串操作 0 A 1 B 2 C 3 AaBa 4 Baca 5 NaN 6 dog 7 cat dtype: object 0 a 1 b 2 c 3 aaba 4 baca 5 NaN 6 dog 7 cat dtype: object 0 A 1 B 2 C 3 AABA 4 BACA 阅读全文

posted @ 2018-12-11 23:42 多一点 阅读(1926) 评论(0) 推荐(0) 编辑

2018年12月9日

pandas 基础操作 更新

摘要: <! TOC "创建一个Series,同时让pandas自动生成索引列" "创建一个DataFrame数据框" "查看数据" "数据的简单统计" "数据的排序" "选择数据(类似于数据库中sql语句)" "另外可以使用标签来选择" "通过位置获取数据" "布尔值索引" "设定数值(类似于sql up 阅读全文

posted @ 2018-12-09 20:42 多一点 阅读(466) 评论(0) 推荐(0) 编辑

2018年11月18日

pandas 基础

摘要: <! TOC "创建一个Series ,同时让pandas自动生成索引列" "创建一个DataFrame数据框" "查看数据" "数据的简单统计" "数据的排序" "选择数据(类似于数据库中sql语句)" "另外可以使用标签来选择" "通过位置获取数据" "布尔值索引" "设定数值(类似于sql u 阅读全文

posted @ 2018-11-18 21:48 多一点 阅读(323) 评论(1) 推荐(1) 编辑

2018年10月16日

机器学习-树模型理论(GDBT,xgboost,lightBoost,随机森林)

摘要: <! TOC "tree based ensemble algorithms" "主要介绍以下几种ensemble的分类器(tree based algorithms)" " xgboost " " lightGBM : 基于决策树算法的分布式梯度提升框架 " " GBDT(Gradient Boo 阅读全文

posted @ 2018-10-16 17:07 多一点 阅读(11928) 评论(0) 推荐(0) 编辑

2018年10月15日

GBDT 详解分析 转+整理

摘要: <! TOC "GBDT" "DT 回归树 Regression Decision Tree" "梯度迭代" "GBDT工作过程实例" "需要解释的三个问题" "既然图1和图2 最终效果相同,为何还需要GBDT呢?" "Gradient呢?不是“G”BDT么?" "这不是boosting吧?Adab 阅读全文

posted @ 2018-10-15 14:23 多一点 阅读(2652) 评论(0) 推荐(0) 编辑

2018年10月12日

kaggle竞赛-保险转化-homesite

摘要: <! TOC "时间格式的转化" "查看数据类型" "查看DataFrame的详细信息" "填充缺失值" "category 数据类型转化" "模型参数设定" "结论" <! /TOC 该项目是针对kaggle中的 "homesite" 进行的算法预测,使用xgboost的sklearn接口,进行数 阅读全文

posted @ 2018-10-12 16:06 多一点 阅读(822) 评论(0) 推荐(0) 编辑

2018年9月20日

美团店铺评价语言处理以及分类(tfidf,SVM,决策树,随机森林,Knn,ensemble)

摘要: 第一篇 "数据清洗与分析部分" 第二篇 "可视化部分" , 第三篇 "朴素贝叶斯文本分类" <! TOC "支持向量机分类" "支持向量机 网格搜索" "临近法" "决策树" "随机森林" "bagging方法" <! /TOC .dataframe tbody tr th:only of type 阅读全文

posted @ 2018-09-20 00:04 多一点 阅读(2246) 评论(0) 推荐(0) 编辑

2018年9月11日

Python变量访问权限控制

摘要: oop1.py文件代码 oop2.py文件代码 另外双下划线变量,类本身可以访问__变量,但是在其它作用域不行 可以通过_classname__变量来访问 在函数方法内,class内,没有用self修饰的变量;【又为临时变量,只在函数内部有效,obj不能访问】 全局变量:在模块内,所有函数方法外,c 阅读全文

posted @ 2018-09-11 18:01 多一点 阅读(1761) 评论(0) 推荐(0) 编辑

2018年9月7日

加州房价预测数据预处理

摘要: <! @import "[TOC]" {cmd="toc" depthFrom=1 depthTo=6 orderedList=false} <! code_chunk_output "本文是该系列读书笔记的第二章数据预处理部分" "获取数据" "数据的初步分析,数据探索" "地理分布" "数据特征 阅读全文

posted @ 2018-09-07 09:45 多一点 阅读(3956) 评论(0) 推荐(0) 编辑

2018年8月30日

flask下载文件中文IE,Edge,Safari文件名乱码

摘要: flask(0.11.2)+python3.6 兼容各个主流浏览器,已经过各种测试(chrome,firefox,safari,IE,Edge) quote是将文件名urlencode化,然后以适应Edge浏览器 阅读全文

posted @ 2018-08-30 11:22 多一点 阅读(1014) 评论(0) 推荐(0) 编辑

上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 28 下一页

导航