以前写过了3个博文,都是关于汉字转拼音的,后来发现都不是很“完美”的解决方案,第一个和第二个利用的unicode编码的范围进行确定汉字的拼音,但是难免有遗漏,这个在后面的实践中发现的,后来第三个方法是穷举了汉字来获得汉字的拼音,虽然已维护好修改,但是我对于它里面包含的微型字库产生了疑虑,是否将所有汉... Read More
posted @ 2015-04-27 15:01 仙人球球 Views(11662) Comments(0) Diggs(1) Edit
最近写脚本发现正则也挺有用的,于是就研究了一下。总结起来使用正则表达式来匹配中文、韩文、日文、拉丁等范围的字符非常方便。这里也用到了unicode编码表相关知识,下面给出wiki的具体链接,有兴趣的童鞋可以去看看。Unicode字符平面映射:http://zh.wikipedia.org/wiki/... Read More
posted @ 2015-04-18 13:19 仙人球球 Views(2514) Comments(0) Diggs(0) Edit
看图说话比较直观:对比复制前后的数据表:使用SQL语句:UPDATE OR ROLLBACK Content SET YINBIAO = YINBIAO2, GESHU = GESHU2 WHERE YINBIAO2 IN (SELECT YINBIAO2 FROM Content WHERE PI... Read More
posted @ 2015-04-15 22:45 仙人球球 Views(784) Comments(0) Diggs(1) Edit
之所以汉字转拼音的博文能出到3,主要是因为没有很完美的C++的解决方案,但是写到了这里可以有一个小结了。以前的方法都有这种那种弊端,如果出现了无法识别的汉字(简体的)就无法修改处理了,但是下面的这种方法却能够随时修改、添加、删除汉字,这样就可以保证汉字转拼音的正确性了。另外,对于繁体中文下面的方法并... Read More
posted @ 2015-04-06 21:09 仙人球球 Views(1819) Comments(0) Diggs(0) Edit
经常看到一些软件的安装说明上写着,修改Windows的环境变量,然后重新启动计算机。这让人不禁产生疑问,修改环境变量之后真的要重启吗?其实只要理解了环境变量的原理就可以做出正确的判断。环境变量是一些系统变量,这些变量对运行的任意一个程序都有效。最简单的确认方法就是 cmd.exe 程序。单击“开始”... Read More
posted @ 2015-04-01 11:31 仙人球球 Views(1778) Comments(0) Diggs(2) Edit
csqlite是非常好用的数据库,同时该数据库是开源的,基于一定原因可能需要编译自己需要的csqlite版本,那么下面介绍内容也会你就会感兴趣了。这里要实现的目标是使用VS工具能够正确编译csqlite源码文件生成csqlite的动态库文件。准备:csqlite源码文件:sqlite-amalgam... Read More
posted @ 2015-03-31 14:20 仙人球球 Views(441) Comments(3) Diggs(0) Edit
对于前面获取字符串汉字全拼音的功能,大家应该有个了解了。现在我又综合广大网友流传的获取字符串汉字拼音首字母的功能进行了整理。介绍如下这个功能写的稍微有点复杂使用3个函数解决了获取字符串汉字首拼音串的问题。代码如下: 1 bool GetChineseCodeGBK(const char *pChin... Read More
posted @ 2015-03-30 18:00 仙人球球 Views(359) Comments(0) Diggs(0) Edit
直到目前我没有找到比较合适的输入汉字输出拼音的函数,那么根据网上流传的几个源码进行了改编,写成了输入汉字输出拼音的函数。对于此函数不能说强大,但是至少稳定可用,输出结果还没有发现什么错误。那么下面我将直接copy代码到这里,共广大网友参考把。类定义: 1 class HanziToPinyin 2 ... Read More
posted @ 2015-03-16 16:52 仙人球球 Views(721) Comments(1) Diggs(0) Edit
指定存储文件编码格式共两篇。此为下篇。对于上篇的内容进行了优化,这样大大提高了代码的通用性和重用性。有兴趣的可以都下载下来对比参考。 1 // test__EncodeAFileToEncodeBFile.cpp : 定义控制台应用程序的入口点。 2 // 3 4 #include... Read More
posted @ 2015-01-25 20:18 仙人球球 Views(486) Comments(0) Diggs(0) Edit
终于搞完了,内容稍微有点多分为两篇把。《指定存储文件的编码格式(上)》《指定存储文件的编码格式(下)》本篇为上篇。主流的文件编码包括:UTF8\UTF8-WITHOUT-BOM\UTF16LE\UTF16BE\ANSI等。中文的windows操作系统默认使用就是ANSI编码。各种编码的主要规则大家可... Read More
posted @ 2015-01-25 20:11 仙人球球 Views(739) Comments(0) Diggs(0) Edit