使用nosql Cassandra0.74来优化phpbb的搜索功能

 

phpbb的搜索功能是基于自己的分词表来搜索的.因为原本的系统中每一个汉字就是一个分割词造成体积非常的大.我自己用dphpbb论坛中的数据显示,负责分词的那个2个表里有上百万条数据.体积加起来是帖子表的十倍.搜索性能越来越差.

下面是我自己用户nosql Cassandra0.74来取代搜索功能的方法:
1 安装 Cassandra0.74 详细方法:
 
2 下载SimpleCassie.0.7.1.6用于连接apache php与Cassandra0.74
下载地址:
 
你也可以到google code下载 不过那个似乎被~~墙~~~了
3 写一个脚本用于将phpbb分词表的数据转移到Cassandra0.74数据库
我自己写了一个,可以使用.
在这里下载:
 
4 写一个php脚本负责关键字搜索并返回帖子id,mysql根据帖子id来找文件速度很给力.这里有一个独立出来的简单代码.可以看看 实现了 or 查询;
源码下载: 

很多人都服务器 vps的内存可能会支持不了默认的Cassandra配置,可以查看这个帖子修改节省100多m内存:
 

posted @ 2011-03-20 15:53  nosqlcn  阅读(228)  评论(0编辑  收藏  举报