10 2013 档案

SegmentReader 批量 dump
摘要:/** * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with * this work for additional information regarding copyright ownership. * The ASF licenses this file to You under the Apache License, Version 2.0 * (the " 阅读全文

posted @ 2013-10-29 09:39 雨渐渐 阅读(386) 评论(0) 推荐(0) 编辑

最大熵模型(二)朗格朗日函数
摘要:求 max h(p) 等价于求: 约束条件为: 构建朗格朗日函数: 阅读全文

posted @ 2013-10-24 14:01 雨渐渐 阅读(222) 评论(0) 推荐(0) 编辑

高等数学(下册)
摘要:第八章:多元函数微分法及其应用 第一节:多元函数的基本概念 第二节:偏导数 一,偏导数的定义及其计算法(12) 阅读全文

posted @ 2013-10-16 17:09 雨渐渐 阅读(150) 评论(0) 推荐(0) 编辑

函数的和,差,积,商的求导法则
摘要:定理1:如果函数u=u(x) 及v=v(x)都在点x具有导数,那么他们的和,差,积,商(除分母为0的点外)都在具有导数且: 阅读全文

posted @ 2013-10-16 16:49 雨渐渐 阅读(2966) 评论(0) 推荐(0) 编辑

导数的定义(一些常用函数的求导公式)
摘要:常数的导数等于0幂函数的导数指数函数的导数对数函数的导数 阅读全文

posted @ 2013-10-16 10:11 雨渐渐 阅读(2561) 评论(0) 推荐(0) 编辑

ubuntu后台运行命令行
摘要:ubuntu 程序后台运行几个方法1. 程序后加上“&” ,即 “./myjob &”, 将命令放入到一个作业队列中,可以用命令“jobs” 查看2. 将1中的命令放在 “()”中, 即 “(./myjob &)”,所提交的作业并不在作业列表中,是无法通过jobs来查看的。3. 使用"nohup", 即 “nohup ./myjob &”,忽略hangup信号,防止shell关闭时程序停掉。4. 使用"setsid", 即“setsid ./myjob”。5. 对已经运行的程序可以用 “disown -hmyjob” 来使某个作业 阅读全文

posted @ 2013-10-13 08:10 雨渐渐 阅读(6406) 评论(0) 推荐(0) 编辑

数学公式做图网站
摘要:http://s1.daumcdn.net/editor/fp/service_nc/pencil/Pencil_chromestore.html 阅读全文

posted @ 2013-10-09 14:18 雨渐渐 阅读(249) 评论(0) 推荐(0) 编辑

导数可导性与连续性关系
摘要:详情:蔡高厅高等数学24定理:如果y=f(x)在x0处可导,则f(x)在x0点必定连续。定理的逆命题为假例2:函数,y=|x|,在x=0点连续,在x=0点不可导。解:自变量在x=0点有增量Δx所以在x=0点连续。证明在某一点连续,则证明在那点x的增量趋向于0的时候,y的增量也趋向于0.证明在某一点可导,则证明在那点y的变化量与x的变化量之比的极限存在。本地极限趋向无穷大,故不可导~ 阅读全文

posted @ 2013-10-09 13:56 雨渐渐 阅读(2907) 评论(0) 推荐(0) 编辑

nutch 二次开发
摘要:/*深度控制*/深度控制:nutch是广域网的深度遍历,我们需要的是垂直采集(即只采集某一个栏目),举例,索引页总计20页,如果只有下一页,则深度为20,如果是1 2 3 4 5……20则深度为2即可。深度是未知的。相当于多了一个参数,不便于管理。解决方案:将深度设为无限大。依靠segments来退出采集,而不是依靠深度。/*批量dump*/目的:org.apache.nutch.segment.SegmentReader 类提供的命令 -dump仅仅是读取一个segment下的网页信息。为了实现批量dump,更改了代码,将输入路径该为\crawl\segments并遍历segments下的文 阅读全文

posted @ 2013-10-08 10:58 雨渐渐 阅读(517) 评论(0) 推荐(0) 编辑

导航