摘要: 阅读全文 »
论文提出了Tree-hybrid MLP(T-MLP)方法,其核心思想是结合GBDT的特征选择和模型集成优势与DNN的高维特征空间和光滑优化特性,通过张量化GBDT特征门、DNN架构剪枝和反向传播协同训练MLP模型,以实现高效、有效的表数据预测。
发表于 2025-01-28 00:29阅读:34评论:0推荐:0
发表于 2025-01-22 00:43阅读:805评论:0推荐:4
摘要: 阅读全文 »
常见的大模型微调、训练工具,包括Axolotl、Llama-Factory、Firfly、Xtuner、Swift、Unsloth、Trainer。
发表于 2025-01-04 10:42阅读:261评论:0推荐:0
摘要: 阅读全文 »
本文探讨了文本匹配的演变,从字面匹配到语义匹配,分析了各自的特点与挑战。字面匹配关注文本的精确重合度,而语义匹配则试图理解文本的深层含义。尽管语义匹配在处理复杂关系时更具优势,但仍面临长短文本匹配、词序感知和多实体关系等难题。期待未来大模型能进一步提升语义匹配的能力。
发表于 2024-12-28 16:34阅读:95评论:0推荐:0
摘要: 阅读全文 »
探索文本匹配的奥秘,一文尽览文本匹配主流方法
发表于 2024-10-31 22:26阅读:87评论:0推荐:0
摘要: 阅读全文 »
秋意浓,看几篇论文解解乏吧~
发表于 2024-09-29 15:08阅读:299评论:0推荐:0
摘要: 阅读全文 »
9月论文速读记录,KDD 2024论文专场,提前祝大家国庆快乐!
发表于 2024-09-04 01:31阅读:271评论:0推荐:3
摘要: 阅读全文 »
新鲜出炉的八月份论文阅读记录
发表于 2024-06-15 18:35阅读:197评论:0推荐:0
摘要:
Sigir2024 ranking 相关论文速读 阅读全文 »
发表于 2024-03-30 23:22阅读:1470评论:0推荐:0
摘要: 阅读全文 »
一键带你运行Pytorch分布式模型训练
发表于 2024-02-29 22:52阅读:388评论:0推荐:2
摘要: 阅读全文 »
大模型如火如荼的今天,不实操实操一下语言模型实在说不过去了