数据分析基本流程 Python基本数据类型 Python各种括号的使用方式
数据分析基本流程 Python基本数据类型 Python各种括号的使用方式
数据分析基本流程
-
数据采集
-
数据挖掘
- 理解业务需求,对挖掘目标进行定义
- 理解数据:进行数据描述,数据质量验证
- 数据准备:收集数据(数据导入与导出)、数据清洗、数据集成
- 建模:选择和应用各种数据挖掘类型
-
数据可视化
- 报表工具
Python基本数据类型
https://www.runoob.com/python3/python3-tutorial.html
-
列表 [],list,相当于数组
- len()
- append()
- insert()
- pop()
-
元组 (),tuple,一旦被定义则不可被更改,但是可以像数组一下按“下标”访问
-
字典 {},key-value
-
定义字典:dic_name =
-
添加/替换:dic_name = ['key']:value,若key=已存在则value会被替换
-
删除元素:dic_name.pop('key')
-
查询value
print(dic.get('key'))
-
查询字典中是否有某个value
print('key' in dic_name)
-
-
集合 ([])
- 定义:set_name = set(['key1', 'key2'])
- 添加:set_name.add('key')
- 删除:set_name.remove('key')
- 查询:print('key' in set_name)
python括号使用原则
在Python中括号的使用原则其实是区分了各种数据类型,比如说
persontype = np.dtype({
'names': ['name', 'age', 'chinese', 'math', 'english'],
'formats': ['S32', 'i', 'i', 'i', 'f']})
{}说明括号内是字典类型
然后[]说明两个key对应的值是以集合的方式存储的
数据挖掘十大算法
- 分类算法:
- C4.5
- 朴素贝叶斯
- SVM
- KNN
- Adaboost
- CART
- 聚类算法:
- K-Means
- EM
- 关联分析:
- Apriori
- 连接分析:
- PageRank