随笔分类 - 随笔
摘要:
论文提出了Tree-hybrid MLP(T-MLP)方法,其核心思想是结合GBDT的特征选择和模型集成优势与DNN的高维特征空间和光滑优化特性,通过张量化GBDT特征门、DNN架构剪枝和反向传播协同训练MLP模型,以实现高效、有效的表数据预测。
阅读全文
论文提出了Tree-hybrid MLP(T-MLP)方法,其核心思想是结合GBDT的特征选择和模型集成优势与DNN的高维特征空间和光滑优化特性,通过张量化GBDT特征门、DNN架构剪枝和反向传播协同训练MLP模型,以实现高效、有效的表数据预测。
阅读全文
摘要:
常见的大模型微调、训练工具,包括Axolotl、Llama-Factory、Firfly、Xtuner、Swift、Unsloth、Trainer。
阅读全文
常见的大模型微调、训练工具,包括Axolotl、Llama-Factory、Firfly、Xtuner、Swift、Unsloth、Trainer。
阅读全文
摘要:
本文探讨了文本匹配的演变,从字面匹配到语义匹配,分析了各自的特点与挑战。字面匹配关注文本的精确重合度,而语义匹配则试图理解文本的深层含义。尽管语义匹配在处理复杂关系时更具优势,但仍面临长短文本匹配、词序感知和多实体关系等难题。期待未来大模型能进一步提升语义匹配的能力。
阅读全文
本文探讨了文本匹配的演变,从字面匹配到语义匹配,分析了各自的特点与挑战。字面匹配关注文本的精确重合度,而语义匹配则试图理解文本的深层含义。尽管语义匹配在处理复杂关系时更具优势,但仍面临长短文本匹配、词序感知和多实体关系等难题。期待未来大模型能进一步提升语义匹配的能力。
阅读全文
摘要:
9月论文速读记录,KDD 2024论文专场,提前祝大家国庆快乐!
阅读全文
9月论文速读记录,KDD 2024论文专场,提前祝大家国庆快乐!
阅读全文
摘要:Sigir2024 ranking 相关论文速读
阅读全文
摘要:
大模型如火如荼的今天,不实操实操一下语言模型实在说不过去了
阅读全文
大模型如火如荼的今天,不实操实操一下语言模型实在说不过去了
阅读全文
摘要:
RAPTOR:递归摘要,树形检索,助力RAG中的多粒度语义文本块检索
阅读全文
RAPTOR:递归摘要,树形检索,助力RAG中的多粒度语义文本块检索
阅读全文
摘要:
长尾问题是个老大难问题了。
在推荐中可以是用户/物料冷启动,在搜索中可以是中低频query、文档,在分类问题中可以是类别不均衡。长尾数据就像机器学习领域的一朵乌云,飘到哪哪里就阴暗一片。今天就介绍来自Google的一篇解决长尾物品推荐的论文。
阅读全文
长尾问题是个老大难问题了。
在推荐中可以是用户/物料冷启动,在搜索中可以是中低频query、文档,在分类问题中可以是类别不均衡。长尾数据就像机器学习领域的一朵乌云,飘到哪哪里就阴暗一片。今天就介绍来自Google的一篇解决长尾物品推荐的论文。
阅读全文
摘要:由于研一的疏忽,导致学科的时候少选了一个学分😥😥😥😥😥,悲催的我只得在研二上学期,其他同学都不用上课的时候,还要每周去上课,到了还要紧张兮兮的准备期末考试,再一次体会到了被期末考试支配的恐惧,特别是我选的是令人望而生畏的随机过程。不过经过一学期的学习,也算摸着了一点随机过程的门道,希望以后
阅读全文
摘要:By - 李沐 要有目标。你需要有目标。短的也好,长的也好。认真定下来的也好,别人那里捡来的也好。就跟随机梯度下降需要有个目标函数一样。 目标要大。不管是人生目标还是目标函数,你最好不要知道最后可以走到哪里。如果你知道,那么你的目标就太简单了,可能是个凸函数。你可以在一开始的时候给自己一些小目标,例
阅读全文

探索文本匹配的奥秘,一文尽览文本匹配主流方法
秋意浓,看几篇论文解解乏吧~
新鲜出炉的八月份论文阅读记录
浙公网安备 33010602011771号