摘要:
自然语言处理机器翻译,搜索,分词,语音识别,手写输入。 规则树基于语法规则实现nlp,复杂,低效,无法实现复杂语句的识别。 统计基于统计实现nlp,使用数学模型(公式,参数),计算出各种情况出现的概率,使用概率最高的。 模型训练收集海量数据(语料库),计算二元,三元,四元,N元词组的出现频率。分词则 阅读全文
摘要:
个人设计,未经实践,欢迎指正。 场景预估请求量:1kw,商品:gbjd,库存:50。 server数量:10。server实现(queryCount + stock in redis)1:限流limit初始为5-10,limit大时,尽量在有人取消时,第一次进来其他用户能秒杀到。 一次处理后,当库存 阅读全文
摘要:
source定义source url,可多个。如:{163.com,qq.com}。 遍历以source为起点,广度优先进行图遍历。具体实现为:将待遍历的url加入队列。每次取列头遍历,并将子节点加入队列。深度优先:递归。 判重使用bloomfilter判断url是否已经遍历过。考虑服务的分布式实现 阅读全文