数据仓库 就是将所有业务数据经汇总处理,构成数据仓库
1记录全部事实
2部分维度与数据的整理(数据集市-DM)
3数据库VS仓库
数据仓库是根据主题建立的
数据库面向应用(OLTP) 仓库针对分析(OLAP)
数据库组织规范,仓库可能冗余,相对变化大,数据量大
数据获取手段-监测与抓取
python常用工具
urllib、urllib2、requests、scrapy