08 2012 档案
摘要:关于utf-8编码简介,可参见这篇博文,写得非常地好。Unicode符号范围 | UTF-8编码方式 (十六进制) | (二进制) --------------------+--------------------------------------------- 0000 0000-0000 007F | 0xxxxxxx 0000 0080-0000 07FF | 110xxxxx 10xxxxxx 0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx 0001 0000-0010 FFFF | 11110xxx 1...
阅读全文
摘要:iconv是一个经常用来转换编码的工具,非常好用。但是今天晚上用它来将utf-8转换成utf-16时,发现它总是会自动在前面插入FEFF的BOM,转换的命令行如下:iconv -f utf-8 -t utf-16 <filename>而我是不需要这个BOM的,当然我可以用外部程序再进行转换一次,去掉前面的BOM,但是难道iconv真就没有考虑到吗?虽然官方文档貌似没有关于这方面的说明,但是google了下,答案果然是否定的,参见这个帖子,也就是说命令行换成这样就行了iconv -f utf-8 -t utf-16le <filename>
阅读全文
摘要:关于dll转lib文件的方法,网上的文章很多,但是我这次转的dll,输出函数是以 __stdcall 打头声明的。稍有不一样,顺便将网上的文章总结下。 转换环境 VS2008 转换步骤 打开 Visual Studio 2008 命令提示 将<vs2008>\VC\bin 和 <vs2008>\Common7\IDE 加入到PATH路径:set PATH=%P...
阅读全文
摘要:公司同事最近利用谷歌拼音输入法源代码实现了自己的拼音输入法,经过了解,最核心的就是一个trie(词典树)的构造和检索(这里不太介绍trie树了,google一搜一大把),于是今天就想实现了一个笔划输入法。大概的想法是:找一个所有汉字或者一、二级汉字的笔顺数据库用Lua将数据库读进来,构造一个trie树每一个节点存一个笔划每一个节点带一个子节点集合每一个节点带一个汉字集合,表示到这一级时所有笔划组成的完整汉字检索时根据用户输入的笔划,检索到一个节点,然后按笔划顺序遍历子树遍历子树可以给出所有以这些笔划开始的所有汉字,但是总不能一下显示出来吧,所以需要一个迭代器,每调用一次给出一个可能的值,这个迭
阅读全文