摘要:
一、tomat启动流程1、启动HttpConnector connector等待连接请求,只负责接受socket请求,具体处理过程交给HttpProcessor处理。 tomcat用户只能访问到connector,能设置接受的数据的buffer大小,而不能看见HttpProcessor的处理过程... 阅读全文
随笔档案-2014年04月
ObjectMonitor,ObjectWaiter 实现wait(),notify()
2014-04-25 15:14 by Loull, 3625 阅读, 收藏, 编辑
摘要:
0、java对象锁监视器在JVM的规范中,有这么一些话:“在JVM中,每个对象和类在逻辑上都是和一个监视器相关联的”“为了实现监视器的排他性监视能力,JVM为每一个对象和类都关联一个锁”“锁住了一个对象,就是获得对象相关联的监视器”监视器好比一做建筑,它有一个很特别的房间,房间里有一些数据,而且在同... 阅读全文
递归
2014-04-25 10:03 by Loull, 368 阅读, 收藏, 编辑
摘要:
一、递归关键之处1、停止条件即如果问题很简单,已经是个不能再分解的任务了,那么就不要用递归来解决。比如这里的number只有一位时。这种没有任何递归调用的情况即是停止条件或基本条件。2、递归调用递归调用自身,用于解决比较简单的问题,在这里即输出除最后一位之外的所有位。二、示例案例1两个人从1开始,轮... 阅读全文
Java线程同步和线程通信
2014-04-24 23:58 by Loull, 1547 阅读, 收藏, 编辑
摘要:
一、线程同步 当多个线程访问同一个数据时,非常容易出现线程安全问题。这时候就需要用线程同步。 不可变类总是线程安全的,因为它的对象状态是不可改变的,但可变类对象需要额外的方法来保证线程安全。1、同步监视器 释放同步监视器的锁定 任何线程进入同步代码块、同步方法之前,... 阅读全文
Java Thread线程控制
2014-04-24 23:40 by Loull, 1236 阅读, 收藏, 编辑
摘要:
一、线程和进程 进程是处于运行中的程序,具有一定的独立能力,进程是系统进行资源分配和调度的一个独立单位。进程特征: A、独立性:进程是系统中独立存在的实体,可以拥有自己独立的资源,每个进程都拥有自己的私有地址地址。在没有经过进程本身允许的情况下,一个用户进程不可以访问其他进程地址空间。 ... 阅读全文
线程同步:互斥锁,条件变量,信号量
2014-04-24 23:28 by Loull, 8097 阅读, 收藏, 编辑
摘要:
线程同步为允许在线程或进程间共享数据,同步通常是必须的。常见的同步方式有:互斥锁、条件变量、读写锁、信号量。另外,对于进程间的同步,也可以通过进程间通信的方式进行同步,包括管道(无名管道、有名管道)、信号量、消息队列、共享内存、远程过程调用,当然也可以通过Socket来进行网络控制。一. 互斥锁和条... 阅读全文
设计推荐系统
2014-04-24 15:19 by Loull, 515 阅读, 收藏, 编辑
摘要:
推荐系统评测的三个步骤一般来说,一个新的推荐算法最终上线,需要完成离线实验,用户调查和在线实验三个步骤。首先需要通过俩西安实验证明它在很多离线指标上优于现有算法。然后,需要通过用户调查确定它的用户满意度不低于现有算法。最后,通过在线的AB测试确定他在我们关心的指标上优于现有算法。一、离线实验离线实验... 阅读全文
寻找第K大的数
2014-04-23 16:17 by Loull, 309 阅读, 收藏, 编辑
摘要:
在一堆数据中查找到第k个大的值。 名称是:设计一组N个数,确定其中第k个最大值,这是一个选择问题,解决这个问题的方法很多。 所谓“第(前)k大数问题”指的是在长度为n(n>=k)的乱序数组中S找出从大到小顺序的第(前)k个数的问题。 解法1: 我们可以对这个乱序数组按照从大到小先行排序,然后取... 阅读全文
算法思想
2014-04-23 13:53 by Loull, 548 阅读, 收藏, 编辑
摘要:
1、递归法所谓递归,就是指如果需要求解当前状态就需要求解其依赖的迁移状态。一般来说,递归需要有边界条件、递归前进段和递归返回段。当边界条件不满足时,递归前进;当边界条件满足时,递归返回。采用递归描述的算法通常有这样的特征:1)为求解规模为N的问题,设法将它分解成规模较小的问题;2)然后从这些小问题的... 阅读全文
LIS 最长递增子序列
2014-04-22 00:12 by Loull, 363 阅读, 收藏, 编辑
摘要:
一、最长公共子序列 经典的动态规划问题,大概的陈述如下: 给定两个序列a1,a2,a3,a4,a5,a6......和b1,b2,b3,b4,b5,b6.......,要求这样的序列使得c同时是这两个序列中的部分(不要求连续),这个就叫做公共子序列,然后最长公共子序列自然就是所有的子序列中最长的... 阅读全文
LeetCode Median of Two Sorted Arrays
2014-04-21 21:56 by Loull, 389 阅读, 收藏, 编辑
摘要:
Median of Two Sorted ArraysThere are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays. The overall run... 阅读全文
LeetCode TwoSum
2014-04-21 15:56 by Loull, 194 阅读, 收藏, 编辑
摘要:
TwoSumGiven an array of integers, find two numbers such that they add up to a specific target number.The function twoSum should return indices of the ... 阅读全文
美国队长
2014-04-08 19:29 by Loull, 416 阅读, 收藏, 编辑
摘要:
从美队1里的初长成到复联里的战术领导再到美队2里的核心领袖,史蒂夫罗杰斯将在未来是艰苦斗争中领导复仇者们共同对抗邪恶势力 史蒂夫为什么能成为复仇者乃至整个美国的正义领袖,在电影复联里很过观众吐槽美国队长实力太弱,弱的可能抵不过钢铁侠的一拳被打飞!但是,美队2里我们一起见证了史蒂夫所蕴含的能量,一种能将人心凝聚到一起、一种能让身边的队友、兄弟、手下完全信任毫无顾忌的将命交给你的信任,最后大战前的演讲能将神盾局的成员凝聚到一起共同对抗九头蛇邪恶组织,可能会有人质疑,仅仅次演讲就能说服神盾局?也许很多人没发现,史蒂夫罗杰斯这个人物已经在电影中的每个美国人所熟知所崇拜所敬仰,我们在笑斯坦李的... 阅读全文
weka数据预处理
2014-04-03 23:09 by Loull, 11484 阅读, 收藏, 编辑
摘要:
Weka数据预处理(一)对于数据挖掘而言,我们往往仅关注实质性的挖掘算法,如分类、聚类、关联规则等,而忽视待挖掘数据的质量,但是高质量的数据才能产生高质量的挖掘结果,否则只有"Garbage in garbage out"了。保证待数据数据质量的重要一步就是数据预处理(Data Pre-Processing),在实际操作中,数据准备阶段往往能占用整个挖掘过程6~8成的时间。本文就weka工具中的数据预处理方法作一下介绍。Weka 主要支持一种ARFF格式的数据,含有很多数据过滤方法。关于ARFF格式文件,可以在此处了解详情。Weka的数据预处理又叫数据过滤,他们可以在wek 阅读全文
weka特征选择(IG、chi-square)
2014-04-03 23:01 by Loull, 3315 阅读, 收藏, 编辑
摘要:
一、说明 IG是information gain 的缩写,中文名称是信息增益,是选择特征的一个很有效的方法(特别是在使用svm分类时)。这里不做详细介绍,有兴趣的可以googling一下。 chi-square 是一个常用特征筛选方法,在种子词扩展那篇文章中,有详细说明,这里不再赘述。二、weka中的使用方法 1、特征筛选代码package com.lvxinjian.alg.models.feature;import java.nio.charset.Charset;import java.util.ArrayList;import weka.attributeSelection.AS... 阅读全文
生成arff文件,csv转为arff
2014-04-03 23:00 by Loull, 5735 阅读, 收藏, 编辑
摘要:
一、什么是arff格式文件 1、arff是Attribute-Relation File Format缩写,从英文字面也能大概看出什么意思。它是weka数据挖掘开源程序使用的一种文件模式。由于weka是个很出色的数据挖掘开源项目,所以使用的比较广,这也无形中推广了它的数据存储格式。 2、下面是weka自带的一个arff文件例子(weather.arff) 1 @relation weather 2 3 @attribute outlook {sunny, overcast, rainy} 4 @attribute temperature real 5 @attribute humidit... 阅读全文
logistic regression的一些问题,不平衡数据,时间序列,求解惑
2014-04-03 22:52 by Loull, 1964 阅读, 收藏, 编辑
摘要:
Logistic Regression1、在有时间序列的特征数据中,怎么运用LR?不光是LR,其他的模型也是。有很多基本的模型变形之后,变成带时序的模型。但,个人觉得,这类模型大多不靠谱。我觉得还是要从业务出发,同时探测分析数据,得出比较合理的假设,然后提取特征,这些特征可以含有时间信息,但不一定是时序的。比如,前N天其他特征的统计组合等。可以参考:Logistic regression for time seriesQ: I would like to use a binary logistic regression model in the context of streaming da. 阅读全文
Feature Scaling
2014-04-03 22:27 by Loull, 514 阅读, 收藏, 编辑
摘要:
定义:Feature scaling is a method used to standardize the range of independent variables or features of data. In data processing, it is also known as data normalization and is generally performed during the data preprocessing step.(来源于wikipedia)简单来说,它主要用来把所有特征值范围映射至同样的范围里面如(0,1)、(-1,1)、(-0.5,0.5)等。Feat 阅读全文