10 2018 档案
摘要:爬虫的原理 先利用requests的get或者post从网页上获取请求,返回一个response对象,通过contents或text读取response文本内容形成html文档,然后利用beautifulsoup对html文档进行解析。 Reuqests库 requests支持两种网页获取方式,一种
阅读全文
摘要:format格式化字符串,将字符串以某种格式化形式输出,基本形式是"***{}***{}***".format(col1,col2)。其中format有两种指定形式,一种是按照index,一种是按照名称。 按照index进行赋值: 按照名称进行赋值: 另外是对数字按照某种格式显示 http://ww
阅读全文
摘要:random中随机数包括主要类型有: 生成随机数和随机选择,其中随机选择可以不单是数字也可以是文本等其他类型。 随机选择的接口是numpy.random.choice(a,size=None,replace=True,p=None),a为一维数组类似数据,如果是整数,对应的一维数组为np.arang
阅读全文