随笔分类 -  随笔

摘要:FunPapers[1]: GBDT和DNN强强联手,表格预测新突破!论文提出了Tree-hybrid MLP(T-MLP)方法,其核心思想是结合GBDT的特征选择和模型集成优势与DNN的高维特征空间和光滑优化特性,通过张量化GBDT特征门、DNN架构剪枝和反向传播协同训练MLP模型,以实现高效、有效的表数据预测。 阅读全文
posted @ 2025-01-28 00:29 Milkha 阅读(297) 评论(0) 推荐(0)
摘要:大模型训练工具,小白也能轻松搞定!常见的大模型微调、训练工具,包括Axolotl、Llama-Factory、Firfly、Xtuner、Swift、Unsloth、Trainer。 阅读全文
posted @ 2025-01-22 00:43 Milkha 阅读(4172) 评论(0) 推荐(4)
摘要:浅谈文本匹配本文探讨了文本匹配的演变,从字面匹配到语义匹配,分析了各自的特点与挑战。字面匹配关注文本的精确重合度,而语义匹配则试图理解文本的深层含义。尽管语义匹配在处理复杂关系时更具优势,但仍面临长短文本匹配、词序感知和多实体关系等难题。期待未来大模型能进一步提升语义匹配的能力。 阅读全文
posted @ 2025-01-04 10:42 Milkha 阅读(1068) 评论(0) 推荐(0)
摘要:语言模型文本匹配的主流方法回顾探索文本匹配的奥秘,一文尽览文本匹配主流方法 阅读全文
posted @ 2024-12-28 16:34 Milkha 阅读(508) 评论(0) 推荐(1)
摘要:论文速读记录 - 202410秋意浓,看几篇论文解解乏吧~ 阅读全文
posted @ 2024-10-31 22:26 Milkha 阅读(256) 评论(0) 推荐(0)
摘要:论文速读记录 - 2024099月论文速读记录,KDD 2024论文专场,提前祝大家国庆快乐! 阅读全文
posted @ 2024-09-29 15:08 Milkha 阅读(592) 评论(0) 推荐(0)
摘要:论文速读纪录 - 202408新鲜出炉的八月份论文阅读记录 阅读全文
posted @ 2024-09-04 01:31 Milkha 阅读(417) 评论(0) 推荐(3)
摘要:Sigir2024 ranking 相关论文速读 阅读全文
posted @ 2024-06-15 18:35 Milkha 阅读(371) 评论(0) 推荐(0)
摘要:Huggingface初上手即ERNIE-gram句子相似性实战大模型如火如荼的今天,不实操实操一下语言模型实在说不过去了 阅读全文
posted @ 2024-02-29 22:52 Milkha 阅读(609) 评论(0) 推荐(2)
摘要:RAPTOR:递归摘要与树形检索的结合,提升RAG检索性能RAPTOR:递归摘要,树形检索,助力RAG中的多粒度语义文本块检索 阅读全文
posted @ 2024-02-08 08:58 Milkha 阅读(1731) 评论(0) 推荐(1)
摘要:Empowering Long-tail Item Recommendation through Cross Decoupling Network (CDN)长尾问题是个老大难问题了。 在推荐中可以是用户/物料冷启动,在搜索中可以是中低频query、文档,在分类问题中可以是类别不均衡。长尾数据就像机器学习领域的一朵乌云,飘到哪哪里就阴暗一片。今天就介绍来自Google的一篇解决长尾物品推荐的论文。 阅读全文
posted @ 2023-09-03 00:36 Milkha 阅读(1090) 评论(0) 推荐(0)
摘要:由于研一的疏忽,导致学科的时候少选了一个学分😥😥😥😥😥,悲催的我只得在研二上学期,其他同学都不用上课的时候,还要每周去上课,到了还要紧张兮兮的准备期末考试,再一次体会到了被期末考试支配的恐惧,特别是我选的是令人望而生畏的随机过程。不过经过一学期的学习,也算摸着了一点随机过程的门道,希望以后 阅读全文
posted @ 2022-01-06 21:51 Milkha 阅读(516) 评论(0) 推荐(0)
摘要:By - 李沐 要有目标。你需要有目标。短的也好,长的也好。认真定下来的也好,别人那里捡来的也好。就跟随机梯度下降需要有个目标函数一样。 目标要大。不管是人生目标还是目标函数,你最好不要知道最后可以走到哪里。如果你知道,那么你的目标就太简单了,可能是个凸函数。你可以在一开始的时候给自己一些小目标,例 阅读全文
posted @ 2021-11-01 16:25 Milkha 阅读(81) 评论(0) 推荐(0)