摘要:
1.重复值的处理方法:所有字段完全相同的重复值,一般直接删除,即只保留一个。 2.缺失值的处理方法: 缺失值占比很高,可以删除(超过60%) 缺失值占比不高:使用均值,中位数,众数填充 缺失值占比不高:用模型拟合填充 3.使用零售电商数据进行举例: 代码: import pandas as pd # 阅读全文
摘要:
1.matplotlib是一个Python的2D绘图库。 2.matplotlib和pyecharts的区别: pyecharts主要可以做交互式的图,风格偏向数据工程demo展示,支持中文。 缺点就是不太好调控,之前数学建模的时候设置柱形图每个的间距,设置不了,它是自动撑开的 matplotlib 阅读全文
摘要:
1.describe()和info()函数 pandas里面有两个重要的函数describe()和info()函数,能够查看数据的一个整体情况,这里我们用经典的泰坦尼克数据集进行演示。 import pandas as pd # 文件路径 path = r'titanic_data.csv' # 如 阅读全文
摘要:
1.识别图片的类型和输出图片的base64 import imghdr import base64 import os if __name__ == '__main__': path = r'1.jpg' with open(path, 'rb') as img_file: if not os.pa 阅读全文
摘要:
网址 https://ai.baidu.com/ai-doc/NLP/zk6z52hds?qq-pf-to=pcqq.c2c 。 开通,自然语言处理->情感倾向分析, 开通按量后付费,QPS限制20,不开通的话,QPS限制为2。 3.情感倾向分析接口(通用版):对只包含单一主体主观信息的文本,进行自 阅读全文
摘要:
评论数据情感分析,其实就是文本挖掘,首先要做的预处理就是分词,英文单词中间有空格隔开,很容易分词。中文没有空格,所以需要去做专门的分词处理。`` 中文分词用jieba库,先安装第三方库 pip install jieba,看下面demo: import jieba s = '中华人民共和国是一个伟大 阅读全文
摘要:
#创建存储过程 CREATE PROCEDURE test_insert() #开始 BEGIN #定义变量 DECLARE i INT DEFAULT 40; #条件判断 WHILE i<=170 #执行 DO #SQL insert into robot(name) values(CONCAT( 阅读全文
摘要:
红色方框要引入箭头里面的 import sys sys.path.append('../../config/') from database import * print(MYSQL_CONFIG) 阅读全文
摘要:
1.大小,7.64G。 2.建议不要安装过高的版本。 3.安装过程,win10系统直接双击R2016a_win64.iso,win7需要右键解压,然后双击setup.exe,然后选择文件安装密钥,填入密钥(09806-07443-53955-64350-21751-41297),选择安装路径(这个路 阅读全文
摘要:
ss攻击全称跨站脚本攻击,xss是一种在web应用中的计算机安全漏洞,它允许用户注入特殊的代码,从而达到攻击的目的,例如,盗取cookie,破坏网页结构,重定向等。 XSS攻击的核心就是靠HTML < script >标签或元素属性来执行Javascript脚本。 评论功能,最简单的输入script 阅读全文