2011年6月29日
摘要: 之前用eclipse建了个web项目,里面要用到中科院分词器和一些外部的数据资源,发现用相对路径总是提示找不到资源,于是用System.getProperty(“user.dir”)发现工作目录竟然是eclipse的安装目录,把资源放在那里,问题解决,附一些常用的Java系统属性值名称: user.dir用户的当前工作目录 java.versionJava 运行时环境版本 java.vendorJ... 阅读全文
posted @ 2011-06-29 11:15 超级福满多 阅读(339) 评论(0) 推荐(0) 编辑
  2011年6月14日
摘要: GBK即汉字内码扩展规范,K为汉语拼音 Kuo Zhan(扩展)中“扩”字的声母。英文全称Chinese Internal Code Specification。 前面说了GB2312只覆盖了常用的汉字,很多后来新加的和生僻字没有加入,为了解决这个问题,中国大陆订定了等同于Unicode 1.1版本的“GB 13000.1-93”,包含20,902个汉字,这里面还包括了台湾及香港使用的繁体字,日语... 阅读全文
posted @ 2011-06-14 11:39 超级福满多 阅读(364) 评论(0) 推荐(0) 编辑
  2011年6月10日
摘要: 一直以来都被ascII,unicode,utf-8,gbk,gb2312,iso-8859-1等等各种和编码相关的概念困扰,另外程序中经常会出现各种因为编码导致的乱码问题,所以今天决定彻底搞懂这些概念之间的联系和区别,总结成若干笔记。 首先来看一个叫“字符集”的概念(这个是自己根据网上的资料定义的,不一定准确)。我们知道计算机中的一切数据,不管是文本、数字、图像、视频还是其他神马的,说到底就是很多... 阅读全文
posted @ 2011-06-10 17:22 超级福满多 阅读(521) 评论(0) 推荐(0) 编辑
  2011年5月12日
摘要: 地址:http://poj.grids.cn/practice/2797/ 输入的时候一开始把字符串末尾的’\0’也输出了,所以总是提示输出错误,后来改了输入方法就对了,细节要注意,另外要学习几种输入输出的方法 #include<iostream>#include<stdio.h>using namespace std;int main(){ char str[1000][21]; int suf... 阅读全文
posted @ 2011-05-12 13:41 超级福满多 阅读(159) 评论(0) 推荐(0) 编辑
  2011年5月8日
摘要: 被一个破空格弄惨了,悲剧,以后还是申请一个大字符数组比较好做#include<iostream>#include<stdio.h>using namespace std;#define NOT_CONS 0 //0: not consecutive;#define CONS 1 //1: consecutive;#define NOT_CONS_FIRST 2 //2: not consecutive and 1st charvoid init(char& in,char& last,int& lastLen,int& state){ w 阅读全文
posted @ 2011-05-08 18:03 超级福满多 阅读(259) 评论(0) 推荐(0) 编辑
  2011年5月6日
摘要: 下文以8位整数为例,第一位表示符号位,0为正,1为负编码说明 所有整数的原码、反码、补码都相同。负数的反码和补码的符号位都不改变,反码其它位求反,补码其它位求反后再加1。同一个二进制数在不同编码中的解释可能不同,一般来说,0开头的8位数据在三种编码中解释相同,而以1开头的则解释不同[+1]原=0000 0001,[+1]反=0000 0001,[+1]补=0000 0001[-1]原=1000 0001,[-1]反=1111 1110,[-1]补=1111 1111 原码表示的范围是[-127~-0,+0~+127],反码的范围和原码一致,补码的范围是[-128~0~+127],不同之处在于 阅读全文
posted @ 2011-05-06 17:33 超级福满多 阅读(636) 评论(0) 推荐(0) 编辑