摘要:
基础练习 FJ的字符串 时间限制:1.0s 内存限制:512.0MB 时间限制:1.0s 内存限制:512.0MB 问题描述 FJ在沙盘上写了这样一些字符串: A1 = “A” A2 = “ABA” A3 = “ABACABA” A4 = “ABACABADABACABA” … … 你能找出其中的规 阅读全文
摘要:
话说有这样一个小例子: MICROS_PER_DAY表示一天的微秒数 MILLIS_PER_DAY表示一天的毫秒数 然后下面例子的结果是多少呢? So easy 数据类型为 long ,很容易保存这两个乘积不产生溢出. 因此,结果肯定是 1000! but….. 结果是:数据溢出!!! 但是但是lo 阅读全文
摘要:
输入: 1 使用BufferedReader方法输入,这种方法很繁琐 2 直接使用System.in输入 3使用Scanner输入,这种方法最好用 阅读全文
摘要:
多线程即是同时运行多个子程序,就像爬取10页网页,笨方法就是从第一页爬到第十页这样最少需要十几分钟 而用多线程创建10个线程同时爬十个网页,理论上速度可扩大10倍 例如: import threading,time class MyThread(threading.Thread): def __in 阅读全文
摘要:
User-Agent 有一些网站不喜欢被爬虫程序访问,所以会检测连接对象,如果是爬虫程序,也就是非人点击访问,它就会不让你继续访问。 所以为了要让程序可以正常运行,需要隐藏自己的爬虫程序的身份。 此时,我们就可以通过设置User Agent的来达到隐藏身份的目的。 User Agent的中文名为用户 阅读全文
摘要:
模拟搜索引擎的关键是知道该搜索引擎的关键词接口 百度的关键词接口是:http://www.baidu.com/s?wd=KEYWORD 360搜索的关键词接口是:http://www.so.com/s?q=KEYWORD 百度搜索Python: import requestskeyword = "P 阅读全文
摘要:
Python爬虫程序获取源码中的内容 requests库用来获取源码: requests.get(url)返回URL页面的源码 requests.raise_for_status()检测链接是否建立成功,只有返回200是成功,其余都会抛出错误给except requests.encoding = r 阅读全文
摘要:
所以我们判断一个字符串是否是合法的Email的方法是: 创建一个匹配Email的正则表达式; 用该正则表达式去匹配用户的输入来判断是否合法。 因为正则表达式也是用字符串表示的,所以,我们要首先了解如何用字符来描述字符。 在正则表达式中,如果直接给出字符,就是精确匹配。用\d可以匹配一个数字,\w可以 阅读全文
摘要:
在Python中,文件读写是通过open()函数打开的文件对象完成的 文件读写时都有可能产生IOError Python引入了with语句来自动帮我们调用close()方法: >>>with open('/path/to/file', 'r') as f: ...print f.read() Pyt 阅读全文