摘要: 特征预处理: 什么是特征预处理? 通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。 我们需要用到一些方法进行无量纲化,使不同规格的数据转换到同一规格 为什么我们要进行归一化/标准化? 特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果 阅读全文
posted @ 2021-01-19 22:56 喜欢爬的孩子 阅读(1311) 评论(0) 推荐(0) 编辑
摘要: sklearn数据集 1 scikit-learn数据集API介绍 sklearn.datasets 加载获取流行数据集 datasets.load_*() 获取小规模数据集,数据包含在datasets里 datasets.fetch_*(data_home=None) 获取大规模数据集,需要从网络 阅读全文
posted @ 2021-01-19 19:07 喜欢爬的孩子 阅读(493) 评论(0) 推荐(0) 编辑
摘要: 源码如下: import jieba import matplotlib.pyplot as plt from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator # 打开文件 text_from_file = open('2019n 阅读全文
posted @ 2021-01-19 12:43 喜欢爬的孩子 阅读(4175) 评论(0) 推荐(0) 编辑
摘要: 直接上代码:(商品名称、单价、图片链接) import pymysql import requests import re def getHTMLText(url): kv = {'cookie':'thw=cn; hng=CN%7Czh-CN%7CCNY%7C156; enc=ooWAQ8HPiB 阅读全文
posted @ 2021-01-19 12:25 喜欢爬的孩子 阅读(466) 评论(0) 推荐(0) 编辑