数据分析基本流程 Python基本数据类型 Python各种括号的使用方式

数据分析基本流程 Python基本数据类型 Python各种括号的使用方式

 

数据分析基本流程

  • 数据采集

  • 数据挖掘

    • 理解业务需求,对挖掘目标进行定义
    • 理解数据:进行数据描述,数据质量验证
    • 数据准备:收集数据(数据导入与导出)、数据清洗、数据集成
    • 建模:选择和应用各种数据挖掘类型
  • 数据可视化

    • 报表工具

 

Python基本数据类型

https://www.runoob.com/python3/python3-tutorial.html

  • 列表 [],list,相当于数组

    • len()
    • append()
    • insert()
    • pop()
  • 元组 (),tuple,一旦被定义则不可被更改,但是可以像数组一下按“下标”访问

  • 字典 {},key-value

    • 定义字典:dic_name =

    • 添加/替换:dic_name = ['key']:value,若key=已存在则value会被替换

    • 删除元素:dic_name.pop('key')

    • 查询value

      print(dic.get('key'))

    • 查询字典中是否有某个value

      print('key' in dic_name)

  • 集合 ([])

    • 定义:set_name = set(['key1', 'key2'])
    • 添加:set_name.add('key')
    • 删除:set_name.remove('key')
    • 查询:print('key' in set_name)

 

python括号使用原则

在Python中括号的使用原则其实是区分了各种数据类型,比如说

persontype = np.dtype({
    'names': ['name', 'age', 'chinese', 'math', 'english'],
    'formats': ['S32', 'i', 'i', 'i', 'f']})

{}说明括号内是字典类型

然后[]说明两个key对应的值是以集合的方式存储的

 

数据挖掘十大算法

  • 分类算法:
    • C4.5
    • 朴素贝叶斯
    • SVM
    • KNN
    • Adaboost
    • CART
  • 聚类算法:
    • K-Means
    • EM
  • 关联分析:
    • Apriori
  • 连接分析:
    • PageRank

 

posted on 2020-07-26 10:15  G-Aurora  阅读(69)  评论(0编辑  收藏  举报