eo_will - 博客园

2018年9月11日

摘要：经过之前学习，单独总结一篇特征工程中的经验和方法，以助于学习和参考。 1、对于理解数据、数据的结构、特点来说，单变量特征选择是个非常好的选择。尽管可以用它对特征进行排序来优化模型，但由于它不能发现冗余（例如假如一个特征子集，其中的特征之间具有很强的关联，那么从中选择最优的特征时就很难考虑到冗余的问题阅读全文

posted @ 2018-09-11 14:08 eo_will 阅读(725) 评论(0) 推荐(0) 编辑

机器学习 | 特征工程- 引言

摘要：特征工程（Feature Engineering）目的是最大限度地从原始数据中提取特征以供算法和模型使用，是数据挖掘模型开发中最耗时、最重要的一步。内容包括：特征处理（Feature Processing）、特征选择（Feature Selection）。本部分系统的总结特征工作的一些基本概念，以阅读全文

posted @ 2018-09-11 14:07 eo_will 阅读(650) 评论(0) 推荐(0) 编辑

机器学习 | 特征工程（一）- 数据预处理

摘要：本文将以iris数据集为例，梳理数据挖掘和机器学习过程中数据预处理的流程。在前期阶段，已完成了数据采集、数据格式化、数据清洗和采样等阶段。通过特征提取，能得到未经处理的特征，但特征可能会有如下问题： - 不属于同一量纲通常采用无量纲化进行处理； - 信息冗余 - 定性特征不能直接使用通常使用哑编阅读全文

posted @ 2018-09-11 14:07 eo_will 阅读(3866) 评论(0) 推荐(1) 编辑

2018年8月25日

PostgreSQL | psycopg2语句汇总

摘要： psycopg2是Python语言的PostgreSQL数据库接口，是对Psycopg 1.1.x版本进行的几乎完全的改写。它的主要优势在于完全支持Python DB API 2.0，以及安全的多线程支持。它适用于随时创建、销毁大量游标的、和产生大量并发INSERT、UPDATE操作的多线程数据库应阅读全文

posted @ 2018-08-25 21:36 eo_will 阅读(4314) 评论(0) 推荐(0) 编辑

PostgreSQL | 学习笔记&语句汇总

摘要： PostgreSQL 是世界上功能最强大的开源关系型数据库，除了标准的 SQL 的支持外，还有丰富的特性，可以通过扩展来增强数据库的能力，如uuid-ossp，pgcrypto，hstore，PostGIS等扩展。支持如 hstore、range、GIS、json 等更多的数据类型。此外，Green 阅读全文

posted @ 2018-08-25 21:28 eo_will 阅读(1616) 评论(0) 推荐(0) 编辑

PostSQL | Debug记录

摘要： 1- csv导入postgreSQL · 问题描述：需要将csv导入到本地数据库，但columns很多，不想通过新建表格，并设置每个字段名称、类型，再用copy from复制 · 解决方案：通过python pandas包可以轻松将csv里的名字和数据导入数据库 from sqlalchemy 阅读全文

posted @ 2018-08-25 21:26 eo_will 阅读(538) 评论(0) 推荐(0) 编辑

Git | 常用操作笔记

摘要： 1. 忽略本地指定文件、目录在git下载到本地的目录中修改.git/info/exclude文件例如git status时忽略所有的.pyc文件 2. 撤销对文件的修改场景：当文件修改了，但没有add，还原最后一次提交的内容注：使用之前需要确认确实要放弃之前的修改，否则会使内容彻底丢失。 3 阅读全文

posted @ 2018-08-25 18:29 eo_will 阅读(236) 评论(0) 推荐(0) 编辑

MySQL | 安装配置和命令行操作（MacOS）

摘要：一、安装 1）homebrew安装 brew install mysql 或者dmg安装 Download MySQL Community Server #后续个人通过Nawicat客户端连接进行操作二、配置路径用文本编辑器打开.bash_profile，加入PATH=$PATH:/usr/lo 阅读全文

posted @ 2018-08-25 16:13 eo_will 阅读(1054) 评论(0) 推荐(0) 编辑

MySQL | 基础教程笔记

摘要： 0 基础 · 关系型数据库管理系统（RDBMS）来存储和管理的大数据量 · 术语主键：主键是唯一的。一个数据表中只能包含一个主键。你可以使用主键来查询数据。外键：外键用于关联两个表。复合键：复合键（组合键）将多个列作为一个索引键，一般用于复合索引。索引：使用索引可快速访问数据库表中的特定信息阅读全文

posted @ 2018-08-25 16:11 eo_will 阅读(320) 评论(0) 推荐(0) 编辑

2018年8月22日

Debug | MySQL Navicat连接error2059

摘要：一、情况描述：本机环境 macOS 10.13.6 MySQL版本 8.0.12 MySQL安装成功，并且命令行成功运行尝试连接Nawicat时报错， 2059 - Authentication plugin 'caching_sha2_password' cannot be loaded: d 阅读全文

posted @ 2018-08-22 14:53 eo_will 阅读(400) 评论(0) 推荐(0) 编辑

EO_Admin

学习记录分享

公告

EO_Admin

学习 记录 分享

公告

学习记录分享