随笔分类 -  数据分析

摘要:案例简介: 本项目是一个针对数据统计与可视化课程的Presentation大作业项目 1.数据采集 智联招聘爬虫,截止于2022.12.15可正常使用。 爬取网站(可以先自己搜一下关键词看看是否充足):https://m.zhaopin.com/sou/positionlist 岗位关键词可以参照: 阅读全文
posted @ 2022-12-15 13:53 孤飞 阅读(775) 评论(0) 推荐(2) 编辑
摘要:先上结果: 定义转换函数代码: def range2min(text): if '千' in text: text=text.replace('千','000')#替换中文为数字 if '万' in text: if '.' in text: text=text.replace('.','') te 阅读全文
posted @ 2022-12-13 22:39 孤飞 阅读(146) 评论(0) 推荐(0) 编辑
摘要:机器学习方法简介 机器学习、人工智能、深度学习是什么关系? 机器学习研究和构建的是一种特殊算法(而非某一个特定的算法),能够让计算机自己在数据中学习从而进行预测。 Arthur Samuel给出的定义指出,机器学习是这样的领域,它赋予计算机学习的能力(这种学习能力)不是通过显著式编程获得的。 不管是 阅读全文
posted @ 2022-11-14 14:17 孤飞 阅读(662) 评论(0) 推荐(1) 编辑
摘要:Python数据分析教程专栏:数据分析 - 标签 - 孤飞 - 博客园 (cnblogs.com) Python数据分析教程(一):Numpy - 孤飞 - 博客园 (cnblogs.com) Python数据分析教程(二):Pandas - 孤飞 - 博客园 (cnblogs.com) 文件处理 阅读全文
posted @ 2022-10-29 16:07 孤飞 阅读(883) 评论(2) 推荐(1) 编辑
摘要:分词:jieba.cut words = jieba.cut("我来到北京大学",cut_all=True) print('全模式:'+'/'.join([w for w in words])) #全模式 words = jieba.cut("我来到北京大学",cut_all=False) prin 阅读全文
posted @ 2022-10-27 18:51 孤飞 阅读(321) 评论(0) 推荐(0) 编辑
摘要:Pandas导入 Pandas是Python第三方库,提供高性能易用数据类型和分析工具 Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用 两个数据类型:Series, DataFrame import pandas as pd Pandas与numpy的比较 Pandas 阅读全文
posted @ 2022-09-20 21:58 孤飞 阅读(913) 评论(0) 推荐(1) 编辑
摘要:本人原创首发链接:https://blog.onefly.top/posts/13140.html 数据的纬度 一维数据:列表和集合类型 二维数据:列表类型 多维数据:列表类型 高维数据:字典类型或数据表示格式,如json、xml、yaml 维度:一组数据的组织形式 列表和数组:一组数据的有序结构 阅读全文
posted @ 2022-09-20 15:21 孤飞 阅读(777) 评论(0) 推荐(1) 编辑