摘要: 论文提出了Tree-hybrid MLP(T-MLP)方法,其核心思想是结合GBDT的特征选择和模型集成优势与DNN的高维特征空间和光滑优化特性,通过张量化GBDT特征门、DNN架构剪枝和反向传播协同训练MLP模型,以实现高效、有效的表数据预测。 阅读全文 »
posted @ 2025-01-28 00:29 Milkha 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 常见的大模型微调、训练工具,包括Axolotl、Llama-Factory、Firfly、Xtuner、Swift、Unsloth、Trainer。 阅读全文 »
posted @ 2025-01-22 00:43 Milkha 阅读(805) 评论(0) 推荐(4) 编辑
摘要: 本文探讨了文本匹配的演变,从字面匹配到语义匹配,分析了各自的特点与挑战。字面匹配关注文本的精确重合度,而语义匹配则试图理解文本的深层含义。尽管语义匹配在处理复杂关系时更具优势,但仍面临长短文本匹配、词序感知和多实体关系等难题。期待未来大模型能进一步提升语义匹配的能力。 阅读全文 »
posted @ 2025-01-04 10:42 Milkha 阅读(261) 评论(0) 推荐(0) 编辑
摘要: 探索文本匹配的奥秘,一文尽览文本匹配主流方法 阅读全文 »
posted @ 2024-12-28 16:34 Milkha 阅读(95) 评论(0) 推荐(0) 编辑
摘要: 秋意浓,看几篇论文解解乏吧~ 阅读全文 »
posted @ 2024-10-31 22:26 Milkha 阅读(87) 评论(0) 推荐(0) 编辑
摘要: 9月论文速读记录,KDD 2024论文专场,提前祝大家国庆快乐! 阅读全文 »
posted @ 2024-09-29 15:08 Milkha 阅读(299) 评论(0) 推荐(0) 编辑
摘要: 新鲜出炉的八月份论文阅读记录 阅读全文 »
posted @ 2024-09-04 01:31 Milkha 阅读(271) 评论(0) 推荐(3) 编辑
摘要: Sigir2024 ranking 相关论文速读 阅读全文 »
posted @ 2024-06-15 18:35 Milkha 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 一键带你运行Pytorch分布式模型训练 阅读全文 »
posted @ 2024-03-30 23:22 Milkha 阅读(1470) 评论(0) 推荐(0) 编辑
摘要: 大模型如火如荼的今天,不实操实操一下语言模型实在说不过去了 阅读全文 »
posted @ 2024-02-29 22:52 Milkha 阅读(388) 评论(0) 推荐(2) 编辑
点击右上角即可分享
微信分享提示