上一页 1 ··· 9 10 11 12 13 14 下一页
摘要: 什么是robots.txt? robots.txt是一个纯文本文件,是爬虫抓取网站的时候要查看的第一个文件,一般位于网站的根目录下。robots.txt文件定义了爬虫在爬取该网站时存在的限制,哪些部分爬虫可以爬取,哪些不可以爬取(防君子不防小人) 更多robots.txt协议信息参考:www.rob 阅读全文
posted @ 2017-12-11 21:54 一只敲码的猫 阅读(7483) 评论(0) 推荐(1) 编辑
摘要: 使用Python 的re模块,re模块提供了re.sub用于替换字符串中的匹配项。 1 re.sub(pattern, repl, string, count=0) 参数说明: pattern:正则重的模式字符串 repl:被拿来替换的字符串 string:要被用于替换的原始字符串 count:模式 阅读全文
posted @ 2017-12-09 19:31 一只敲码的猫 阅读(18216) 评论(0) 推荐(0) 编辑
摘要: Python里一共有三种字符串匹配方式,用于判断一个字符串是否包含另一个字符串。比如判断字符串“HelloWorld”中是否包含“World”: 阅读全文
posted @ 2017-12-06 20:20 一只敲码的猫 阅读(19459) 评论(0) 推荐(0) 编辑
摘要: 在使用BeautifulSoup库时出现该警告,虽然不影响正常运行,但强迫症不能忍啊!! 详细警告信息如下: 解决办法:指定HTML解析器 阅读全文
posted @ 2017-12-05 17:19 一只敲码的猫 阅读(1037) 评论(0) 推荐(0) 编辑
摘要: 使用如下命令: 然后输入以下代码: 再使用以下命令使配置生效: 这样就可以使用brew命令了 阅读全文
posted @ 2017-12-05 13:53 一只敲码的猫 阅读(5661) 评论(0) 推荐(1) 编辑
摘要: 思路:看到题目首先想到最大字符串匹配KMP算法 参考后代码 阅读全文
posted @ 2017-12-04 20:35 一只敲码的猫 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 题目要求:给定两个非空的链表,且链表里的元素都是非负整数,对这两个链表里的元素进行相加,返回一个新的链表。 Input: (2 -> 4 -> 3) + (5 -> 6 -> 4)Output: 7 -> 0 -> 8 思考过程:第二个元素进行相加:4+6=10,只保留了个位上的数,原本进位到十位的 阅读全文
posted @ 2017-11-09 11:09 一只敲码的猫 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 题目要求:给定一个整型数组,以及一个目标值,求出数组中两个元素之和为目标值的元素下标,以整型数组形式返回 相关知识:Java数组的创建与赋值 JAVA中数组的定义格式有如下三种: 第一中方式:int[] arr = new int[3]; 第二种方式:int[] arr1= new int [] { 阅读全文
posted @ 2017-11-09 10:02 一只敲码的猫 阅读(287) 评论(0) 推荐(0) 编辑
摘要: 在配置完Hadoop集群后,使用命令:“start-all.sh”进行启动集群。然后使用命令:“jps”查看进程启动情况,发现没有NodeManager 只需要使用命令:cd /usr/local/hadoop/hadoop-2.7.4/etc/hadoop 进入该目录后,使用命令“vim yarn 阅读全文
posted @ 2017-10-23 17:34 一只敲码的猫 阅读(10919) 评论(0) 推荐(1) 编辑
摘要: 第一步:使用配置Tomcat服务器的Eclipse新建一个名为“TestSpringMVC”的web项目 第二步:将所使用的jar包复制到WEB-INF/lib目录下 第三步:在web.xml中配置DispatcherServlet DispatcherServlet就是SpringMVC的入口,S 阅读全文
posted @ 2017-09-27 19:18 一只敲码的猫 阅读(348) 评论(0) 推荐(0) 编辑
上一页 1 ··· 9 10 11 12 13 14 下一页