摘要: 小市值因子是很重要的选股策略,主要意思就是,小市值的股票涨幅通常会比较大。具体执行的方法可以是:每周末(或每个月末)选出市值最小的10只股票,下周初(或下月初)平均资金买入,到下下周(或下下个月)再换10只,如此循环。本节代码可以生成所有股票最近的交易数据,按市值排序,也可以根据设置,选出市值最小的 阅读全文
posted @ 2020-03-21 18:38 djl_djl 阅读(849) 评论(0) 推荐(0) 编辑
摘要: 本节代码将每天获取所有股票的数据(开、高、低、收盘价,前收盘价,成交量),结合股票历史数据(也可以不结合,只从当天开始),构建完整的实时股票日数据库,保存为csv格式。下载数据用python自带的urllib库,处理数据用pandas库。可在每天15点以后运行,更新所有股票的日数据。 from ur 阅读全文
posted @ 2020-03-21 18:23 djl_djl 阅读(1191) 评论(0) 推荐(0) 编辑
摘要: 爬取赶集网数据时发现一些有用的小技巧,不一定用到,先记下来备用。 一、代理服务器 有些网站服务器限制访问IP的数量,即1个IP过多的访问网站则会被屏蔽,这是就需要设置多个代理地址,来模拟多IP访问的情况。 1、 首先从网上获取可使用的代理服务器地址,获取代理地址的网站(IP和端口): http:// 阅读全文
posted @ 2020-03-21 16:16 djl_djl 阅读(260) 评论(0) 推荐(0) 编辑
摘要: 爬取赶集网二手物品下所有物品的信息。大致思路:1、爬取频道页url;2、爬取商品详情页url,写入mongodb,url_list表;3、从url_list表读取url,爬取商品信息,写入mongodb,p_info表分成3个py文件:1、channel_url.py,获取频道页url;2、page 阅读全文
posted @ 2020-03-21 16:11 djl_djl 阅读(408) 评论(0) 推荐(0) 编辑