摘要: 一、wordcloud是什么 词云,在一段文本中提取关键词进行扁平化的展示,更能吸引目标客户的眼球。 市面上有很多在线生成词云的工具,本文以Python中的第三方库wordcloud为例讲解如何自动生成词云图 二、在python3环境中安装 1. 使用conda install wordcloud或 阅读全文
posted @ 2019-03-22 16:18 aby321 阅读(2709) 评论(0) 推荐(0) 编辑
摘要: 1 """ 2 3 用selenium+PhantomJS配合,不需要进行逆向工程 4 python 3下的selenium不能默认安装,需要指定版本2.48.0 5 """ 6 from selenium import webdriver 7 import os,requests 8 9 10 11 url = 'https://mus... 阅读全文
posted @ 2019-03-12 14:31 aby321 阅读(1107) 评论(2) 推荐(0) 编辑
摘要: 一、背景介绍 1.1 一些专业名称的解释 MUA——Mail User Agent,邮件用户代理。是用户与电子邮件系统的交互接口,一般来说它就是我们PC机上的一个程序,提供一个好的用户界面,它提取用户在其界面填写的各项信息,生成一封符合SMTP等邮件标准的邮件,然后采用SMTP协议将邮件发送到发送端 阅读全文
posted @ 2019-02-12 17:46 aby321 阅读(859) 评论(0) 推荐(0) 编辑
摘要: 题记: 11月14日早晨8点,人人网发布公告,宣布人人公司将人人网社交平台业务相关资产以2000万美元的现金加4000万美元的股票对价出售予北京多牛传媒,自此,人人公司将专注于境内的二手车业务和在美国的投资业务。 人人网CEO陈一舟说:“很高兴为人人网找到一个新的归宿和起点。” 然而对于人人网曾经近 阅读全文
posted @ 2019-01-25 18:38 aby321 阅读(3706) 评论(0) 推荐(0) 编辑
摘要: 上文解决了起点中文网部分数字反爬的信息,详细链接https://www.cnblogs.com/aby321/p/10214123.html 本文研究另一种文字反爬的机制——猫眼电影实时票房反爬 虽然都是仅仅在“数字”上设置了反爬,相同点与不同点如下: 相同点: 不同点: 映射关系怎么找呢? 通过研 阅读全文
posted @ 2019-01-07 22:32 aby321 阅读(3377) 评论(0) 推荐(0) 编辑
摘要: 2.3 在python中安装fontTools包,网页源代码中的数字与英文单词的对应关系 结果是: 3. 通过2.2与2.3 可以看出来解码需要两步: 第一步:将正则匹配出来的6位数字先转换成英文单词 第二步:将英文单词转换成阿拉伯数字 然后就ok啦 源代码: 1. 正则匹配没有展开讲,自行度娘吧 阅读全文
posted @ 2019-01-03 14:45 aby321 阅读(2961) 评论(0) 推荐(0) 编辑
摘要: 1. 查看API接口说明 地址:http://lbsyun.baidu.com/index.php?title=webapi/guide/webservice-geocoding 注:callback的功能暂未研究 2. 申请自己的ak(类似于连通百度地图服务器的钥匙,请勿泄露) 注:调试阶段,应用 阅读全文
posted @ 2018-12-24 15:21 aby321 阅读(2531) 评论(0) 推荐(0) 编辑
摘要: 初学Python的盆友们是否有这样的疑惑: 选择Python2还是Python3呢?(后者并不完全兼容前者) 听说两者可以同时安装,那怎么管理呢? Python那么丰富的第三方库,一个一个装太麻烦啦 选哪种IDE呢? …… 诸如此类的问题,相信大多数初学者跟刚入门的我一样都是一脸懵逼,程序员在于折腾 阅读全文
posted @ 2018-12-12 16:39 aby321 阅读(10548) 评论(0) 推荐(1) 编辑
摘要: 可生成普通二维码、带图片的艺术二维码(黑白与彩色)、动态二维码(黑白与彩色)。 GitHub:https://github.com/sylnsfar/qrcode 中文版:https://github.com/sylnsfar/qrcode/blob/master/README-cn.md 已封装成 阅读全文
posted @ 2018-12-05 10:25 aby321 阅读(11128) 评论(3) 推荐(0) 编辑
摘要: 参照上一篇爬虫小猪短租的思路https://www.cnblogs.com/aby321/p/9946831.html,继续熟悉基础爬虫方法,本次爬取的是咪咕音乐的排名 咪咕音乐榜首页http://music.migu.cn/v2/music/billboard/?_from=migu&page=1 阅读全文
posted @ 2018-11-14 14:18 aby321 阅读(1790) 评论(0) 推荐(0) 编辑