2010年5月14日
摘要: 使用语言Python实现的算法:寻找频繁项集源码如下:# -*- coding: cp936 -*-def candidate_gen(F_prior):#F_prior是一个双层list 为项目集 '''候选项集集合生成函数''' candidate=[] print '下面进行合并:' for list1 in F_prior:for list2 in F_prior: if list1!=N... 阅读全文
posted @ 2010-05-14 22:58 finallyly 阅读(1202) 评论(0) 推荐(1) 编辑
摘要: 1.想实现对一个二类文本问题的两种分类方法,首先要对文档集合的文本进行分词,然后建立倒排表,倒排表是借助于mysql数据库的,但是有一个众所周知的事情,mysql插入汉字会出现各种莫名奇妙的情况,首当其冲是插不进去,而获是插进去了,但是显示是乱码,然后将插入后的数据再读到程序中仍然是乱码。这归根结底是编码符号不一致的问题也就是。再解决这个问题的过程中,我参考了http://www.busfly.c... 阅读全文
posted @ 2010-05-14 21:52 finallyly 阅读(7516) 评论(7) 推荐(1) 编辑
摘要: 再谈乱码问题,如何解决MYSQL数据中文乱码问题 在之前的文章里,我已经提过如何解决JSP中乱码问题(解决tomcat下中文乱码问题 ),其中也详细解说了MYSQL乱码问题,相信通过里面的办法,肯定都已经解决了JSP里的乱码问题,不过还是有些人的MYSQL乱码问题没有得到解决,包括我自己,所以又找了一些资料,希望这次能完全解决MYSQL数据库的乱码问题。 第一种方法,很精辟的总结:经常更换虚拟主机... 阅读全文
posted @ 2010-05-14 20:37 finallyly 阅读(33131) 评论(0) 推荐(2) 编辑