上一页 1 ··· 38 39 40 41 42
摘要: SparkSql 是架构在 Spark 计算框架之上的分布式 Sql 引擎,使用 DataFrame 和 DataSet 承载结构化和半结构化数据来实现数据复杂查询处理,提供的 DSL可以直接使用 scala 语言完成 Sql 查询,同时也使用 thriftserver 提供服务化的 Sql 查询功能。 阅读全文
posted @ 2019-05-14 16:09 vivo互联网技术 阅读(3414) 评论(0) 推荐(0) 编辑
摘要: 机器学习排序(Learning to rank)将搜索转化为机器学习问题,在本文中,我想找出搜索与其他机器学习问题不同的原因,如何将搜索排名作为机器学习或者是分类和回归问题?我们将通过两种方法,对机器学习排序方法的评估有个直观的认识。 阅读全文
posted @ 2019-04-30 09:48 vivo互联网技术 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 如何应用深度学习向量来实现高效的搜索。这一方法适用于想要寻找相似文档而普通关键词查询不够好的任何应用场景。其中的嵌入向量,可以使用诸如 doc2vec 等来实现。 阅读全文
posted @ 2019-04-16 11:01 vivo互联网技术 阅读(661) 评论(0) 推荐(1) 编辑
摘要: 本篇概括性的介绍了OOD的设计原则,后续还有更多文章会详细剖析、吃透面向对象业务设计的原则。 阅读全文
posted @ 2019-03-29 14:52 vivo互联网技术 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 本文首发于InfoQ https://www.infoq.cn/article/1sm0Mq5LyY_021HGuXer 作者:Anton Hägerstrand 翻译:杨振涛 目录: 数据量 版本 节点配置 索引结构 性能 Meltwater每天要处理数百万量级的帖子数据,因此需要一种能处理该量级 阅读全文
posted @ 2019-03-26 16:14 vivo互联网技术 阅读(563) 评论(0) 推荐(1) 编辑
摘要: 本文对 MySQL 数据库中有关锁、事务及并发控制的知识及其原理做了系统化的介绍和总结,希望帮助读者能更加深刻地理解 MySQL 中的锁和事务,从而在业务系统开发过程中可以更好地优化与数据库的交互。 阅读全文
posted @ 2019-03-14 09:53 vivo互联网技术 阅读(932) 评论(0) 推荐(1) 编辑
上一页 1 ··· 38 39 40 41 42