2013年12月16日

网络爬虫及分布式系统

摘要: 一.抓取网页 1.URL Web 上每种可用的资源, 如HTML 文档、 图像、 视频片段、 程序等都由一个通用资源标志符(Universal Resource Identifier,URI)进行定位。 URI 通常由三部分组成:①访问资源的命名机制;②存放资源的主机名;③资源自身的名称。 URL 是 URI 的一个子集。 它是 Uniform Resource Locator 的缩写, 译为 “统一资源定位符”。通俗地说,URL 是 Internet 上描述信息资源的字符串,主要用在各种 WWW 客户程序和服务器程序上, 特别是著名的 Mosaic。 采用 URL 可以用一种统一的... 阅读全文

posted @ 2013-12-16 21:10 依蓝jslee 阅读(2164) 评论(0) 推荐(2) 编辑

数字

摘要: 1.给定任意一个正整数,求比这个数大且最小的“不重复数”,“不重复数”的含义是相邻两位不相同,例如1101是重复数,而1201是不重复数。 1 package number; 2 3 /** 4 * 给定任意一个正整数,求比这个数大且最小的“不重复数”,“不重复数”的含义是相邻两位不相同,例如1101是重复数,而1201是不重复数。 5 * @author hasee 6 * 7 */ 8 public class repeatBit { 9 public static void main(String[] args) {10 int NumGived = 9... 阅读全文

posted @ 2013-12-16 18:52 依蓝jslee 阅读(171) 评论(0) 推荐(0) 编辑

数组

摘要: 1.顺时针打印数组 eg: 1 2 3 4 5 6 7 8 9 打印出来,结果为1 2 3 6 9 8 7 4 5 解: 注意 * * (只有一行) 只有一列,行列不同等情况。 1 package offer; 2 3 /** 4 * 剑指offer p127 20题 5 * @author hasee 6 * 7 */ 8 public class PrintArr { 9 public static void print(int[][] arr){10 if(arr == null)11 return;12 ... 阅读全文

posted @ 2013-12-16 18:10 依蓝jslee 阅读(220) 评论(0) 推荐(0) 编辑

导航