摘要: Rethinking the Role of Pre-ranking in Large-scale E-Commerce Searching system 这篇论文对粗排的角色进行了分析,讨论了粗排过度模拟精排的问题,分别从离线评估方式、样本构造、目标构造和学习框架上进行了改进。论文没有花太多篇幅在模型框架的创新上,而是在深入的分析和解决真实粗排场景中常见的问题,在各种细节上也处理的很到位,如多个正样本的list-wise损失函数的改造上。完整、仔细地读下来,对理清粗排的整个流程和挑战都很有帮助,值得学习。 阅读全文
posted @ 2023-07-09 22:19 Milkha 阅读(139) 评论(0) 推荐(0) 编辑
摘要: [TOC] 大语言模型势不可挡啊。 哲学上来说,语言就是我们的一切,语言所不能到达的地方我们也不能达到。就人类来说,语言或许已经不仅仅是一种工具那么简单,其不仅是人类在物理世界进行活动时不可或缺的媒介,也是我们自身构建精神世界时的一砖一瓦。语言的重要性已经无需多言了。 教会计算机人类的语言(用人类的 阅读全文
posted @ 2023-06-22 22:03 Milkha 阅读(631) 评论(0) 推荐(0) 编辑
摘要: Addictive & Multiplicative in NN 浅谈一下Addictive和Multiplicative 阅读全文
posted @ 2023-05-05 18:02 Milkha 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 机器学习中常用的模型评价指标及其应用场景 Accuracy, Recall, Precision, F-score 先看一下它们的计算公式: $$ ACC = \frac{TP + TN}{TP+FN+TN+FP}\quad Recall = \frac{TP}{TP+FN}\quad Precision = \frac{TP}{TP+FP 阅读全文
posted @ 2023-04-06 16:31 Milkha 阅读(56) 评论(0) 推荐(0) 编辑
摘要: 关于大模型对未来影响的一点看法 人们总是高估了未来一到两年的变化,低估了未来十年的变革。 比尔盖茨 近来OpenAI的GPT技术可以说在全球都带来了巨大的影响,也让大家看到了什么叫大力出奇迹。chatGPT和GPT4的能力给了大家很大的震撼,其流畅自如、逻辑清晰、出众的能力,给使用过的人都留下了深刻的印象,同时也让无数人对这项技术 阅读全文
posted @ 2023-03-23 20:16 Milkha 阅读(470) 评论(0) 推荐(1) 编辑
摘要: 一个例子了解operator+ 直击 operator+ 的秘密 阅读全文
posted @ 2023-03-08 09:36 Milkha 阅读(19) 评论(0) 推荐(0) 编辑
摘要: 庐陵乡土“订婚”文化简记 乡土文化简记 阅读全文
posted @ 2023-02-10 01:01 Milkha 阅读(92) 评论(0) 推荐(0) 编辑
摘要: Spark Shuffle 这一篇主要讲 Spark 中的 Shuffle 机制. Shuffle Write Shuffle Read 将 job 划分成多个 task 后, stage 内的一个 task 可以在一个节点上完成计算, task 内以来的数据可以直接存储在当前结点上 (内存或者磁盘中). 但是 stage 间 阅读全文
posted @ 2022-10-31 15:52 Milkha 阅读(40) 评论(2) 推荐(0) 编辑
摘要: Spark 逻辑处理流程与物理执行计划 一直以来都想了解一下 Spark 的运行原理, 但一直都浮于表面, 难以深入. 去年买了一本 《大数据处理框架 Apache Spark 设计与实现》, 但是一直没时间好好看看, 最近抽时间过了一下这本书, 在此记录一下. 这一篇主要讲 Spark 中逻辑处理流程时怎么生成的, 以及在逻辑处理流程的 阅读全文
posted @ 2022-10-31 15:29 Milkha 阅读(222) 评论(0) 推荐(0) 编辑
摘要: Spark Overview 一直以来都想了解一下 Spark 的运行原理, 但一直都浮于表面, 难以深入. 去年买了一本 《大数据处理框架 Apache Spark 设计与实现》, 但是一直没时间好好看看, 最近抽时间过了一下这本书, 在此记录一下. 先大致了解一下 Spark. Introducion Spark Appli 阅读全文
posted @ 2022-10-31 15:27 Milkha 阅读(27) 评论(0) 推荐(0) 编辑