2019 年 12月 17 日随笔档案 - vsop_479

2019年12月17日

摘要：自然语言处理机器翻译，搜索，分词，语音识别，手写输入。规则树基于语法规则实现nlp，复杂，低效，无法实现复杂语句的识别。统计基于统计实现nlp，使用数学模型（公式，参数），计算出各种情况出现的概率，使用概率最高的。模型训练收集海量数据（语料库），计算二元，三元，四元，N元词组的出现频率。分词则阅读全文

posted @ 2019-12-17 18:10 vsop_479 阅读(153) 评论(0) 推荐(0) 编辑

秒杀设计

摘要：个人设计，未经实践，欢迎指正。场景预估请求量：1kw，商品：gbjd，库存：50。 server数量：10。server实现（queryCount + stock in redis）1：限流limit初始为5-10，limit大时，尽量在有人取消时，第一次进来其他用户能秒杀到。一次处理后，当库存阅读全文

posted @ 2019-12-17 18:02 vsop_479 阅读(129) 评论(0) 推荐(0) 编辑

爬虫

摘要： source定义source url，可多个。如：{163.com，qq.com}。遍历以source为起点，广度优先进行图遍历。具体实现为：将待遍历的url加入队列。每次取列头遍历，并将子节点加入队列。深度优先：递归。判重使用bloomfilter判断url是否已经遍历过。考虑服务的分布式实现阅读全文

posted @ 2019-12-17 17:57 vsop_479 阅读(87) 评论(0) 推荐(0) 编辑

vsop_479

公告