HYLOVEYOURSELF

小洋宝的进步史

导航

2024年12月21日

越狱IDEA~全网唯一 !!!😊

摘要: 是未来的越狱界新星的越狱idea(会搞懂越狱机制保护大家的!)!冲冲冲!目前包含源于冬令营和5×论文带来的灵感,一定会坚持更新的!👌 阅读全文

posted @ 2024-12-21 19:42 岁月月宝贝 阅读(1) 评论(0) 推荐(0) 编辑

2024年12月19日

你的语言模型实际是一个奖励模型!😁Direct Preference Optimization:Your Language Model🎭is Secretly a Reward Model

摘要: 直接偏好优化:你的语言模型实际上是一个奖励模型!文章提出了DPO算法,我用自己的语言把它表达得很清晰(100%精读哦)🏋️‍♀️~ 阅读全文

posted @ 2024-12-19 14:23 岁月月宝贝 阅读(6) 评论(1) 推荐(0) 编辑

2024年12月15日

Datawhale 2025冬令营第二弹!!😊自己微调模型!

摘要: Datawhale 2025冬令营第二弹!!定制垂类大模型 = 优质数据集 + 开源大模型😘 阅读全文

posted @ 2024-12-15 17:44 岁月月宝贝 阅读(30) 评论(2) 推荐(1) 编辑

2024年12月14日

Many-shot Jailbreaking💘足够长的上下文长度有利于各种越狱?

摘要: Many-shot Jailbreaking💘足够长的上下文长度有利于各种越狱? 阅读全文

posted @ 2024-12-14 15:19 岁月月宝贝 阅读(1) 评论(0) 推荐(0) 编辑

2024年12月13日

感觉这是一篇真正学者完成的文章🙇MASTERKEY: Automated Jailbreaking of Large Language Model Chatbots

摘要: 感觉这是一篇真正学者完成的文章🙇MASTERKEY: Automated Jailbreaking of Large Language Model Chatbots MASTERKEY: Automated Jailbreaking of Large Language Model Chatbots谢谢作者,受益匪浅! 阅读全文

posted @ 2024-12-13 12:21 岁月月宝贝 阅读(2) 评论(0) 推荐(0) 编辑

2024年12月12日

这是一个举报帖🙃

摘要: 这是一个举报帖🙃,牛翰网上这位与我同名的“岁月月宝贝”(下图)涉嫌对我博客的抄袭!!! 本人原帖链接:https://www.cnblogs.com/HYLOVEYOURSELF/p/18556772 抄袭者帖子链接:https://www.niucores.com/forum-post/31078.html 阅读全文

posted @ 2024-12-12 09:40 岁月月宝贝 阅读(15) 评论(0) 推荐(0) 编辑

2024年12月11日

多语言越狱很棒!😊MULTILINGUAL JAILBREAK CHALLENGES IN🧜‍♀️LARGE LANGUAGE MODELS

摘要: 多语言越狱很棒!😊MULTILINGUAL JAILBREAK CHALLENGES IN🧜‍♀️LARGE LANGUAGE MODELS 写这篇的时候第一次认识到了附录内容的重要性(bushi只是这篇读了全部的附录),它可以让你明确文章全部的实验,并且其中包含很多辅助你对正文理解的表格👍 阅读全文

posted @ 2024-12-11 23:09 岁月月宝贝 阅读(5) 评论(0) 推荐(0) 编辑

一篇复杂的研究🤔A Comprehensive Study of 😨Jailbreak Attack versus Defense for Large Language Models

摘要: 本🐏认为,这篇文章的亮点在于对攻击和防御技术的多维评估,另外通过比较不同模型(如Vicuna、LLama和GPT-3.5 Turbo)对攻击和防御策略的反应,文章提供了对模型间差异的深入理解。 对现有的防御策略的评估相对详细,说出了很多文章没有考虑到的良性提问分类错误,并且还细致到了输入是否包含某段符号。 👍 禁止盗用,侵权必究!!!欢迎大家积极举报🐾 阅读全文

posted @ 2024-12-11 15:18 岁月月宝贝 阅读(5) 评论(0) 推荐(0) 编辑

2024年12月10日

古早的遗传算法碰到LLM->😊AutoDAN Generating Stealthy Jailbreak Prompts on💗Aligned Large Language Models

摘要: 古早的遗传算法碰到LLM->😊AutoDAN Generating Stealthy Jailbreak Prompts on💗Aligned Large Language Models 阅读全文

posted @ 2024-12-10 15:22 岁月月宝贝 阅读(5) 评论(0) 推荐(0) 编辑

2024年12月9日

Datawhale 2025冬令营“嬛嬛,我来啦!”😘

摘要: Datawhale2025冬令营笔记来啦!! 阅读全文

posted @ 2024-12-09 14:54 岁月月宝贝 阅读(38) 评论(0) 推荐(0) 编辑