摘要: 1、不能用谷歌浏览器下载安装,不然会出现如下错误: 具体原因是什么不清楚,我用IE浏览器下载安装就没有问题,都是再同一个网址上面下载下来的; 2、就是在新建mongo.cfg文件的时候里面的内容一定要注意大小写,像这样: 我就是dbPath写成了dbpath,就一直在出问题 3、还有就是这就命令:" 阅读全文
posted @ 2017-05-01 23:01 睚一 阅读(208) 评论(0) 推荐(0) 编辑
摘要: from bs4 import BeautifulSoup import requests link_list = [] def get_soup(url): #获取网页的HTML文件,并用BeautifulSoup做成soup html = requests.get(url) soup = BeautifulSoup(html.text,'lxml') ... 阅读全文
posted @ 2017-04-30 00:34 睚一 阅读(271) 评论(0) 推荐(0) 编辑
摘要: import requests import re import time from bs4 import BeautifulSoup today = time.strftime('%Y-%m-%d',time.localtime(time.time())) one_url = 'http://hz.house.qq.com' #用来构建新的URL的链接 url = 'http://... 阅读全文
posted @ 2017-04-26 12:01 睚一 阅读(319) 评论(0) 推荐(0) 编辑
摘要: import requests import re import xlwt def Get_news(): url = 'https://www.jin10.com/' html = requests.get(url) html.encoding = html.apparent_encoding r 阅读全文
posted @ 2017-04-25 16:22 睚一 阅读(428) 评论(0) 推荐(0) 编辑
摘要: import requests from bs4 import BeautifulSoup import xlwt #写入Excel的库 def excel_write(MV_list): newtable = 'MV.xls' #创建Excel文件的名称 wb = xlwt.Workbook(encoding = 'utf-8') #创建Ex... 阅读全文
posted @ 2017-04-24 16:50 睚一 阅读(223) 评论(0) 推荐(0) 编辑
摘要: PS: 1、爬取的内容里面还有链接没有处理干净,虽然别人给了个源码,但是自己看不懂!(还要加油!↖(^ω^)↗↖(^ω^)↗) 2、视频里面说要模拟浏览器登入,但是我这里没有模拟还是可以正常的爬取(我用的是Python3) 阅读全文
posted @ 2017-02-11 19:53 睚一 阅读(1944) 评论(0) 推荐(0) 编辑
摘要: 1 import urllib.request 2 import re 3 4 5 def get_html(page): #获取网页的HTML 6 url = 'http://search.51job.com/jobsearch/search_result.php?fromJs=1&jobarea=000000%2C00&district... 阅读全文
posted @ 2017-02-05 21:31 睚一 阅读(4064) 评论(0) 推荐(0) 编辑
摘要: 在做logistics回归之前,我们要先对你要做预测的变量做个相关分析,找出和你因变量相关的自变量。我这里就不做了,直接用我处理之后的数据。 打开我们要分析的数据,单击“分析”,选择“回归”,然后选择“二元Logistics回归”,弹出下面的界面,如图: 把是否购买移到因变量框里面去,把消费金额和消 阅读全文
posted @ 2016-07-20 23:26 睚一 阅读(39660) 评论(0) 推荐(1) 编辑
摘要: 做RFM分析的时候要知道RFM分析的数据格式有两种: 一种是交易数据,也就是每次交易占用一行,关键变量是客户ID、交易日期和交易金额; 另一种是客户数据,就是每个客户占用一行,关键变量是客户ID、交易金额、交易次数和最近交易日期。 为了保证数据的准确性,建议采用交易数据格式进行分析,实际上交易数据是 阅读全文
posted @ 2016-07-17 13:35 睚一 阅读(14012) 评论(0) 推荐(1) 编辑
摘要: 一些概念性的知识点我这里没有写,直接放个例子在这里。 第一步: 定义日期标示量: 打开数据文件,单击"数据",选择"定义日期和时间",弹出"定义日期"对话框, 数据中的起始时间就是数据文件里面的单元格第一个时间,我的第一个是1997年8月,每行表示的是月度销售量,因此,需要从"定义日期"对话框的左侧 阅读全文
posted @ 2016-07-12 21:21 睚一 阅读(109107) 评论(0) 推荐(0) 编辑