摘要: 抓取豆瓣影评数据,实现词云展现、数据统计等简要分析 阅读全文
posted @ 2016-08-17 11:13 pattywgm 阅读(2995) 评论(0) 推荐(0) 编辑
摘要: 为了验证Splinter的多种动作,这里将使用Splinter模拟博客园里面新增随笔的操作。 第一步:登录博客园,方法同Splinter学习--初探2,模拟博客园登录 第二步:跳转到“添加随笔”界面,跳转步骤为点击“我的博客” --> “新随笔“ 这里通过 find_link_by_text(tex 阅读全文
posted @ 2016-02-02 18:31 pattywgm 阅读(633) 评论(0) 推荐(0) 编辑
摘要: 目前,qq邮箱的登录方式有: 1、利用账号、密码登录 2、快捷登录,前提是你本地已有qq账号登录中 和前面一样,还是先到qq邮箱登录首页,审查页面元素,找到我们进行登录操作所相关的链接、按钮或是输入框。 QQ邮箱登录首页:https://mail.qq.com/ 打开登录页,可以看到两种登录方式选择 阅读全文
posted @ 2016-02-02 15:55 pattywgm 阅读(3348) 评论(0) 推荐(0) 编辑
摘要: 推荐一个免费的论文查重网站:http://www.paperfree.cn 这一次想模拟登录操作,从较为简单的开始,博客园的登录一般不需要验证码,就拿它试验了。 首先,打开园子登录首页http://passport.cnblogs.com/user/signin,查看页面元素,找到用户名和密码输入框 阅读全文
posted @ 2016-02-01 13:02 pattywgm 阅读(830) 评论(0) 推荐(0) 编辑
摘要: Splinter是以Selenium, PhantomJS 和 zope.testbrowser为基础构建的web自动化测试工具,基本原理同selenium 支持的浏览器包括:Chrome, Firefox(默认) 模拟百度搜索Splinter from splinter import Browse 阅读全文
posted @ 2016-01-29 21:50 pattywgm 阅读(1424) 评论(0) 推荐(0) 编辑
摘要: 机器能做的事就别让人来做!目标: 抓取特定微信公众号文章思路:利用selenium模拟浏览器行为,进行抓取(理由:搜狗已将文章链接进行处理,且页面为动态生成)框架: 步骤:1、登录搜狗 a、找到登录按钮并点击 self.browser.find_element_by_id("loginbtn"... 阅读全文
posted @ 2015-12-30 14:12 pattywgm 阅读(12929) 评论(1) 推荐(1) 编辑
摘要: Hibernate充当应用程序和数据库之间的中间件,实现二者之间的交互操作,他对JDBC进行了封装,以完全面向对象的方式来操作数据。适用于有多个数据源的情况下,不必去考虑不同数据源的操作差异。 Hibernate将类型对象与数据库表建立映射关系,把类的属性映射称为数据库表的字段,Hiberna... 阅读全文
posted @ 2015-07-17 14:53 pattywgm 阅读(725) 评论(0) 推荐(0) 编辑
摘要: 1、对持久化对象的要求 1)提供一个无参构造器 2)提供一个标识属性,如id,通常映射为数据库表的主键字段。 3)为持久化类的字段提供get、set方法。 注:但不一定所有字段都这么做,对于不提供get、set方法的字段,在映射文件(*.hbm.xml)中要进行处理。 例如某个属性... 阅读全文
posted @ 2015-07-16 17:45 pattywgm 阅读(1084) 评论(3) 推荐(2) 编辑
摘要: Python:List (列表)list 为Python内建类型,位于__builtin__模块中,元素类型可不同,元素可重复,以下通过实际操作来说明list的诸多功能,主要分为增、删、改、查list帮助:在IDE中输入 help(list)可查看Help on class list in modu... 阅读全文
posted @ 2015-03-11 19:17 pattywgm 阅读(583) 评论(0) 推荐(0) 编辑
摘要: 一、安装官方链接:http://pynlpir.readthedocs.org/en/latest/installation.html官方网页中介绍了几种安装方法,大家根据个人需要,自行参考!我采用的是:Install PyNLPIR using easy_install:$ easy_instal... 阅读全文
posted @ 2015-01-14 18:09 pattywgm 阅读(5050) 评论(0) 推荐(1) 编辑