摘要: 原文:http://stackoverflow.com/questions/14580752/elasticsearch gives different scores for same documents 1. 由于每个shard是一个独立的lucene 实例,所以TF/IDF也是独立计算的,每个... 阅读全文
posted @ 2015-11-29 21:00 wang# 阅读(1679) 评论(0) 推荐(0) 编辑
摘要: 概述 研究论坛搜索如何综合时间和TF/IDF权重。 自定义权重计算的效率问题 数据结构 假设有一个论坛的搜索 字段包括: subject:标题 message:内容 dateline:发布时间 tagid:论坛id 直接通过注释一个查询语句来直观了解如何使用json来查询数据。 ... 阅读全文
posted @ 2015-11-29 16:38 wang# 阅读(1666) 评论(0) 推荐(0) 编辑
摘要: 买了本新书后,kindle 3 自己没事就在那边重启,几分钟一次 查到解决方案1: https://answers.yahoo.com/question/index?qid=20140408155650AAdw06v 原文抄下,防止链接失效 Amazon doesn't repair ol... 阅读全文
posted @ 2015-11-23 19:05 wang# 阅读(2913) 评论(0) 推荐(0) 编辑
摘要: 在delete一条数据后,再insert 相同内容的数据,结果看起来是成功的,但是当你去查找这个数据,却没有任何内容,整个过程并且没有任何异常提示。 这往往发生在单元测试的时候,我们反复清理和写入数据,单元测试有时候成功,有时候失败。 这对单元测试来说,简直就是噩梦。。。 从论坛上收集的一些信息... 阅读全文
posted @ 2015-10-27 10:17 wang# 阅读(270) 评论(0) 推荐(0) 编辑
摘要: CQL 3.1 最后更新 2015年10月10日 maxTimeuuid() now() dateOf() minTimeuuid() 阅读全文
posted @ 2015-10-10 15:09 wang# 阅读(1743) 评论(0) 推荐(0) 编辑
摘要: Cassandra 2. CQL3.1 最近更新:2015 10 30 索引的设计 在Cassandra中经常会发现,索引不够用,不好用,各种不强大。 比如,我关注的人的需求uid + follow 作为主键,没人觉得有什么问题,但是查看我关注的人的时候,需要用关注的时间排序,这就麻烦了... 阅读全文
posted @ 2015-10-08 16:06 wang# 阅读(1339) 评论(1) 推荐(0) 编辑
摘要: 类型错误 类型错误调试的技巧 有时候,类型错误提示比较不友好,比如不知道哪个字段出错。 在php中可以用 Expected 4 or 0 byte int (3) 一般是错误的类型,比如string,被写入到int类型,因为int是4个字节 Invalid uuid value: '1... 阅读全文
posted @ 2015-09-30 13:08 wang# 阅读(407) 评论(0) 推荐(0) 编辑
摘要: 瀑布式分页如果你的应用只需要瀑布式的分页,那么,Cassandra可以很好的支持,不过记得要指定好排序顺序。 常见的分页,跳页问题许多产品喜欢设计可以跳页的分页逻辑比如下面这种 首页 1 <span style="color:red;" 2</span 3 4 5 下一页 GO [ ] 页由于C... 阅读全文
posted @ 2015-09-22 10:20 wang# 阅读(1447) 评论(0) 推荐(0) 编辑
摘要: 一、最重要:这里定义代码审核必须检查的项目: 这些项目都涉及较严重破坏或者难以逆转的操作。 SQL是否有慢查询 包括: 1. 未使用索引的查询,或者忘记设置索引,或者索引不合理:比如没有给唯一数据设计唯一索引或者并发锁 2. 查询数据量过多,大多数丢弃 3. 频繁的或者很容易触发大分页查询或者大量数 阅读全文
posted @ 2015-09-16 15:48 wang# 阅读(420) 评论(0) 推荐(0) 编辑
摘要: Cassandra在国内资料少,用的也不多,大家更多抱观望态度吧。 为了扩大Cassandra队伍帮助自己采坑,决定写一篇文章,就自己对Cassandra的理解范围进行介绍。 选用Cassandra的基本原因 1. 集群,集群意味着存储能力、负载能力的平行扩展,多节点提供快速故障转移,这是主要原因。 阅读全文
posted @ 2015-09-07 19:25 wang# 阅读(2766) 评论(0) 推荐(0) 编辑