10 2016 档案
摘要:在SQL的使用过程中,我们经常要做些数据备份以及定时执行的任务。 这些任务能够帮助我们简化工作过程。 下面我们了解下如何创建一个定时执行的存储过程。 首先我们要打开 SQL server 代理服务 选择计算机—— 设备管理—— 服务与应用程序—— 服务—— SQL server 代理 把SQL se
阅读全文
摘要:在R的使用中,为了方便提取数据, 我们经常要进行数据库进行操作,接下来我们尝试使用R进行连接数据。 这里我们使用R中的RODBC进行操作, 首先,我们需要先配置ODBC资源管理器 通过任务管理器或者win+R运行odbcad32.exe,进入odbc数据源管理器 点击添加,选择native clie
阅读全文
摘要:在python中时间数据类型有date(日期)和time(时间)两种数据类型。 主要用到的模块包含,datetime,time以及calendar模块。 时间类型 import datetime as dt now=dt.datetime.now() print(now) 结果为 2016 10 0
阅读全文
摘要:前面讲完了字符处理,但对数据进行整体性的聚合运算以及分组操作也是数据分析的重要内容。 通过数据的聚合与分组,我们能更容易的发现隐藏在数据中的规律。 数据分组 数据的分组核心思想是:拆分 组织 合并 首先,我们了解下groupby这个函数 import numpy as np import panda
阅读全文
摘要:在数据分析中,特别是文本分析中,字符处理需要耗费极大的精力, 因而了解字符处理对于数据分析而言,也是一项很重要的能力。 字符串处理方法 首先我们先了解下都有哪些基础方法 首先我们了解下字符串的拆分split方法 str='i like apple,i like bananer' print(str.
阅读全文
摘要:前面我们用pandas做了一些基本的操作,接下来进一步了解数据的操作, 数据清洗一直是数据分析中极为重要的一个环节。 数据合并 在pandas中可以通过merge对数据进行合并操作。 import numpy as np import pandas as pd data1 = pd.DataFram
阅读全文
摘要:pandas是基于numpy包扩展而来的,因而numpy的绝大多数方法在pandas中都能适用。 pandas中我们要熟悉两个数据结构Series 和DataFrame Series是类似于数组的对象,它有一组数据和与之相关的标签组成。 结果为: 0 21 52 83 9dtype: int64 结
阅读全文
摘要:在python 中有时候我们用数组操作数据可以极大的提升数据的处理效率, 类似于R的向量化操作,是的数据的操作趋于简单化,在python 中是使用numpy模块可以进行数组和矢量计算。 下面来看下简单的例子 结果: [2 5 6 8 3] 结果: [[2 5 6 8 3] [0 1 2 3 4]]
阅读全文

浙公网安备 33010602011771号