摘要: 这学期学了一门课《信息检索》,也就是传说中的搜索引擎大作业自然而然的让我们自己做一个小型的搜索引擎。于是乎,我们本次的主题就诞生了我也是边学边用,下面和大家一起分享我在这个过程中学到的东西,说的不对的请大家指正这是我的成果搜索引擎--范例,大家可以点进去看看,点此下载所有文件盒源代码按照流程,下面我... 阅读全文
posted @ 2014-07-03 15:55 2BiTT 阅读(458) 评论(0) 推荐(0) 编辑
摘要: 现在基本没有什么能离得开数据库了,django我一直用的都是mysql的数据库,这次和大家说说django--mysql数据库的一些常用命令吧1:命令行登陆mysqlC:\Users\Administrator>mysql -uroot -pEnter password: ********2:创建一... 阅读全文
posted @ 2014-07-03 15:51 2BiTT 阅读(945) 评论(0) 推荐(0) 编辑
摘要: 纯中文和中英文混杂的唯一区别是,分词的时候你如何辨别一个字符是英文字符还是孩子字符,人眼很容易区分,但是对于计算机来说就没那么容易了,只要能辨别出中文字符和英文的字符,分词本身就不是一个难题1:文本的编码问题: utf8:windows下,以utf8格式保存的文本是一个3个字节(以16进制)的BO... 阅读全文
posted @ 2014-07-03 14:28 2BiTT 阅读(2362) 评论(0) 推荐(0) 编辑