摘要: # 前言 ## 为什么用Decoder only LLM之所以主要都用Decoder-only架构,除了训练效率和工程实现上的优势外,在理论上是因为Encoder的双向注意力会存在低秩问题,这可能会削弱模型表达能力,就生成任务而言,引入双向注意力并无实质好处。而Encoder-Decoder架构之所 阅读全文
posted @ 2023-06-17 22:39 阿杰也请你吃颗糖 阅读(1119) 评论(0) 推荐(0) 编辑
摘要: | 模型 | 训练数据 | 训练数据量 | 模型参数量 | 词表大小 | | | | | | | | LLaMA | 以英语为主的拉丁语系,不包含中日韩文 | 1T/1.4T tokens | 7B、13B、33B、65B | 32000 | | ChatGLM-6B | 中英双语,中英文比例为1: 阅读全文
posted @ 2023-06-17 22:39 阿杰也请你吃颗糖 阅读(7182) 评论(0) 推荐(0) 编辑
摘要: # # T5 采用Encoder Decoder架构 T5将每个文本处理问题都看做 Text2Text问题 通过这种方式将不同的NLP任务统一在一个模型框架之下,充分进行迁移学习 为了让模型知道需要执行的任务类型,需要在输入文本前添加特定的文本前缀进行提示,也是最早的Prompt 用同样的模型,同样 阅读全文
posted @ 2023-06-17 22:38 阿杰也请你吃颗糖 阅读(598) 评论(0) 推荐(0) 编辑
摘要: 题目 有一个二维矩阵 A 其中每个元素的值为 0 或 1 。 移动是指选择任一行或列,并转换该行或列中的每一个值:将所有 0 都更改为 1,将所有 1 都更改为 0。 在做出任意次数的移动后,将该矩阵的每一行都按照二进制数来解释,矩阵的得分就是这些数字的总和。 返回尽可能高的分数。 示例: 输入:[ 阅读全文
posted @ 2021-12-30 17:49 阿杰也请你吃颗糖 阅读(43) 评论(0) 推荐(0) 编辑
摘要: #题目 给定两个大小相等的数组 A 和 B,A 相对于 B 的优势可以用满足 A[i] > B[i] 的索引 i 的数目来描述。 返回 A 的任意排列,使其相对于 B 的优势最大化。 示例 1: 输入:A = [2,7,11,15], B = [1,10,4,11] 输出:[2,11,7,15] 示 阅读全文
posted @ 2021-07-12 00:33 阿杰也请你吃颗糖 阅读(99) 评论(0) 推荐(0) 编辑
摘要: 路网匹配解决方案 建模过程 要素 路网由路段组成; 基站网络由各个基站位置组成; 基站序列 匹配过程 输入为基站网络中的基站序列 输出为路段序列 匹配过程为:寻找某一个路段为起点,最后寻找他周边的连通路段,逐渐在搜索空间中扩充路径,最终得到(一条或多条)完整路径,可以在此基础上再对路径进行调整改进与 阅读全文
posted @ 2021-06-19 23:03 阿杰也请你吃颗糖 阅读(1881) 评论(0) 推荐(0) 编辑
摘要: ####- 第一次写了初稿,学长帮忙一起修改,提了很多写论文的思想,记在小本本上... 摘要很重要!先写一次摘要,然后写文章,回来修改文章结构,再写摘要,再请老师帮忙修改....反正很重要 参考文献最好是最近三年的,否则要么是有重大突破,要么就是论文内容不是关注热点,而且尽量是找基本是985高校以上 阅读全文
posted @ 2020-10-24 22:00 阿杰也请你吃颗糖 阅读(86) 评论(0) 推荐(0) 编辑
摘要: #题目 给定一个链表,删除链表的倒数第 n 个节点,并且返回链表的头结点。 示例: 给定一个链表: 1->2->3->4->5, 和 n = 2. 当删除了倒数第二个节点后,链表变为 1->2->3->5. 说明: 给定的 n 保证是有效的。 进阶: 你能尝试使用一趟扫描实现吗? #思路 如果不要求 阅读全文
posted @ 2020-10-19 21:03 阿杰也请你吃颗糖 阅读(232) 评论(0) 推荐(0) 编辑
摘要: #关于Python实现树结构和链表结构的一点想法 ###Python由于内置的数据结构具有很高的灵活性,所以可以用很多种方式来构建树、图、链表等结构 ##1. 树的Python实现 python自然可以使用class来创建Node结点类和Trie类,然后通过left和right属性保存Node结点来 阅读全文
posted @ 2020-10-18 21:36 阿杰也请你吃颗糖 阅读(405) 评论(0) 推荐(0) 编辑
摘要: #题目 给定一个数组 A,将其划分为两个不相交(没有公共元素)的连续子数组 left 和 right, 使得: left 中的每个元素都小于或等于 right 中的每个元素。 left 和 right 都是非空的。 left 要尽可能小。 在完成这样的分组后返回 left 的长度。可以保证存在这样的 阅读全文
posted @ 2020-10-12 19:58 阿杰也请你吃颗糖 阅读(111) 评论(0) 推荐(0) 编辑