11 2013 档案

摘要:Java Character 实现Unicode字符集介绍 CJK中文字符和中文标点判断主要内容:1. Java Character类介绍;2. Unicode 简介及 UnicodeBlock 与 UnicodeScript区别和联系3. 如何判断汉字及中文标点符号做中文信息处理,经常会遇到如何判断一个字是否是中文,或者是否是中文的标点符号等。在Java中,主要使用 Character类处理字符有关功能,而JDK 1.7中Character是按照Unicode 6.0版本实现的,所以这个要先学习下常用的 Unicode编码。具体的定义、历史等请见 wikiwikipediaCharacter 阅读全文
posted @ 2013-11-17 02:16 Tong Zeng 阅读(25892) 评论(2) 推荐(3) 编辑
摘要:好吧, 吐嘈一下:前几天写代码时发现 Double 有几个静态成员变量, 如MAX_VALUE,MIN_VALUE等, 当时就自己"故名思意"了, 分别当成了 double 能表示的最大, 最小值来用了.几天调试程序时发现了离奇的错误, 找了很久才找到错误, 见下例:double temp = Double.MIN_VALUE;if (0<temp){return true;}else {return false;}你认为返回值是true? 还是 false?实际运行返回的是逆天的 true !!!无语, 查文档吧,static doubleMAX_VALUEA co 阅读全文
posted @ 2013-11-11 02:37 Tong Zeng 阅读(1349) 评论(1) 推荐(0) 编辑
摘要:Java方法的参数传递方式为: 值传递对于基本数据类型作为参数传递时, 是"按值传递", 这点都认识很清楚. 但是, 当对象或者说引用作为参数传递, Java 的参数传递方式是"按值传递", 还是"按引用传递",对于新接触Java的朋友来说, 可能有点难以分清. 甚至可能有些用过一段时间的朋友对此也有争议.首先我观点是Java参数传递方式只有一种, 就是按值传递.先看一个代码, 如下:public class Word { public Word(String word) { this.str = word; } public Str 阅读全文
posted @ 2013-11-10 20:44 Tong Zeng 阅读(913) 评论(0) 推荐(0) 编辑
摘要:平时在一些数据处理中,经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有:1. 缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数字。2. 取对数后,可以将乘法计算转换称加法计算。3. 某些情况下,在数据的整个值域中的在不同区间的差异带来的影响不同。例如,中文分词的mmseg算法,计算语素自由度时候就取了对数,这是因为,如果某两个字的频率分别都是500 阅读全文
posted @ 2013-11-06 01:02 Tong Zeng 阅读(32449) 评论(0) 推荐(2) 编辑

点击右上角即可分享
微信分享提示