上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 33 下一页
摘要: MRR(Mean Reciprocal Rank): 是一个国际上通用的对搜索算法进行评价的机制,即第一个结果匹配,分数为1,第二个匹配分数为0.5,第n个匹配分数为1/n,如果没有匹配的句子分数为0。最终的分数为所有得分之和。 把标准答案在被评价系统给出结果中的排序取倒数作为它的准确度,再对所有的 阅读全文
posted @ 2017-02-22 10:03 陈泽泽 阅读(1058) 评论(0) 推荐(0) 编辑
摘要: 免安装的tomcat双击startup.bat后,启动窗口一闪而过,而且tomcat服务未启动,下面与大家分享下原因及解决方法 免安装的tomcat双击startup.bat后,启动窗口一闪而过,而且tomcat服务未启动。 原因是:在启动tomcat是,需要读取环境变量和配置信息,缺少了这些信息, 阅读全文
posted @ 2017-02-20 15:09 陈泽泽 阅读(424) 评论(0) 推荐(0) 编辑
摘要: 该网站对于采集器存在以下限制: 一、验证码限制 在访问频率较高的情况下会出现访问页面需要输入验证码,如下图: 此验证码的生成方式为动态验证码,即每次访问一次验证码生成链接,生成的验证码都不一样,验证码动态生成链接为:http://wenshu.court.gov.cn/User/ValidateCo 阅读全文
posted @ 2017-02-17 10:23 陈泽泽 阅读(885) 评论(1) 推荐(0) 编辑
摘要: 验证码识别,爬虫永远的话题~ 用打码兔总体的体验就是单线程速度太慢~ 测试结果如下: 用多线程测试,明显快多了 测试30个账号,平均每个3秒 阅读全文
posted @ 2017-02-15 19:23 陈泽泽 阅读(3529) 评论(0) 推荐(0) 编辑
摘要: 大多数 JVM 将内存区域划分为 Method Area(Non-Heap)(方法区),Heap(堆),Program Counter Register(程序计数器), VM Stack(虚拟机栈,也有翻译成JAVA 方法栈的),Native Method Stack (本地方法栈) 其中Metho 阅读全文
posted @ 2017-02-13 16:37 陈泽泽 阅读(2899) 评论(0) 推荐(0) 编辑
摘要: 什么是多态 1.面向对象的三大特性:封装、继承、多态。从一定角度来看,封装和继承几乎都是为多态而准备的。这是我们最后一个概念,也是最重要的知识点。 2.多态的定义:指允许不同类的对象对同一消息做出响应。即同一消息可以根据发送对象的不同而采用多种不同的行为方式。(发送消息就是函数调用) 3.实现多态的技术称为:动态绑定(dynamic binding),是指在执行期间判断所引用对象的实际类型,根... 阅读全文
posted @ 2017-02-13 16:10 陈泽泽 阅读(17238) 评论(0) 推荐(2) 编辑
摘要: submit方法会产生Future对象,它用Callable返回结果的特定类型进行了参数化,可以用isDone()的方法来查询Future是否已经完成。当任务完成是,它具有一个结果,可以调用get()方法来获取该结果。 用isDone()的方法来查询Future是否已经完成 改进版: Runnabl 阅读全文
posted @ 2017-02-08 11:10 陈泽泽 阅读(291) 评论(0) 推荐(0) 编辑
摘要: JVM内存模型和结构 GC原理,性能调优 调优:Thread Dump, 分析内存结构 class 二进制字节码结构, class loader 体系 , class加载过程 , 实例创建过程 阅读全文
posted @ 2017-02-08 09:21 陈泽泽 阅读(83) 评论(0) 推荐(0) 编辑
摘要: cd amazon_crawler_system/SharedStorage/amazon_client rm -rf captcha1/ ./transportFile.sh SharedStorage/thriftEndWorker.sh ./thriftEndServer.sh ./thriftStartServer.sh SharedStorage/thriftSta... 阅读全文
posted @ 2017-02-08 08:51 陈泽泽 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 主要注意前面2个设置(根据情况自己设置内存大小)和 ob_end_clean();函数的调用。 阅读全文
posted @ 2017-01-19 16:34 陈泽泽 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 插入表格过程中建立触发器 -- 触发器 同时插入有用数据DROP TRIGGER IF EXISTS t_afterinsert_on_t_product;CREATE TRIGGER t_afterinsert_on_t_productAFTER INSERT ON t_productFOR EA 阅读全文
posted @ 2017-01-18 14:28 陈泽泽 阅读(232) 评论(0) 推荐(0) 编辑
摘要: 1、Runnable和Callable的区别 (1) Callable规定的方法是 call(), Runnable规定的方法是 run()。 (2) Callable的任务执行后可返回值,而 Runnable的任务是不能返回值。 (3) call方法可以抛出异常, run方法不可以。 (4)运行 阅读全文
posted @ 2017-01-17 14:55 陈泽泽 阅读(5226) 评论(1) 推荐(0) 编辑
摘要: 用Ubuntu的apt包管理工具安装的mysql数据库,默认将数据库文件保存在/var/lib/mysql目录下,时间久了数据库越来越大,所以准备挂载个新的硬盘专门存放mysql数据库。 1、确定mysql数据库文件存放目录 一般默认是在/var/lib/mysql目录下。先登录自己的mysql数据 阅读全文
posted @ 2017-01-17 10:54 陈泽泽 阅读(1787) 评论(0) 推荐(0) 编辑
摘要: 目前 partition table 大概有叁种: 最传统的 mbr、大容量的 gpt、小设备的 无; 遇上最后那种就会出现 "doesn't contain a valid partition table(不包含有效的分区表)" 提示 ...意思就是说你还没有分区!解决办法可以参考下面的方法: 发 阅读全文
posted @ 2017-01-12 09:30 陈泽泽 阅读(6022) 评论(0) 推荐(0) 编辑
摘要: 第一、检查硬盘设备是否有数据盘 42G是系统盘那么就剩下了200G的剩余空间,那么下面我就把这200G挂载。 查询命令: sudo fdisk -l 我们可以看到有200GB的数据盘没有挂载,看好前面的路径/dev/vdb1 第二、数据硬盘分区 执行命令: sudo fdisk /dev/vdb 依 阅读全文
posted @ 2017-01-12 09:21 陈泽泽 阅读(606) 评论(0) 推荐(0) 编辑
上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 33 下一页