摘要:
IDA-VLM: Towards Movie Understanding via ID-Aware Large Vision-Language Model 故事:现在的LVLM只能处理单场景,跨场景中关联实体的能力不行。比如电影中同一个角色在不同场景中出现,现有的LVLM不能把相同角色合并。所以本文 阅读全文
摘要:
Abstract: 具身人工智能(Embodied AI)让机器人有规划、执行动作序列的能力,以在物理环境中完成长期任务。本文提出EmbodiedGPT,它是一个端到端的多模态基础模型,赋予具身代理多模态理解和执行能力。本文的贡献主要有三点: 制作了一个大规模的具身规划数据集EgoCOT。该数据集包 阅读全文
摘要:
Towards Explainable NLP: A Generative Explanation Framework for Text Classification Abstract 现有的可解释性机器学习系统关注于解释输入和输出的联系。而细粒度的信息(标签的文字解释)经常被忽略,并且系统不说人话 阅读全文
摘要:
Visualizing and Understanding Neural Models in NLP Abstract 虽然神经网络已成功地应用于许多NLP任务,但基于向量的模型是非常难以解释的。例如,人们不清楚它们是如何实现组合性的,即从单词和短语的意义组合起来构建句子的意义。在本文中,我们描 阅读全文
摘要:
基于递归和注意力机制的神经模型解释 Interpreting Recurrent and Attention-Based Neural Models: a Case Study on Natural Language Inference Abstract 在本文中,我们通过一个NLI神经模型的案 阅读全文
摘要:
1. SVM描述 $f(x)$满足间隔最大化要求。与$f(x)$相对应的直线$\omega^Tx+b=-1$和$\omega^Tx+b=1$之间的间隔为$\frac{2}{||\omega||}$。显然,只有直线$\omega^Tx+b=-1$和$\omega^Tx+b=1$上分布的样本点对选取决策 阅读全文
摘要:
Fisher准则函数 Fisher准则的基本原理:找到一个最合适的投影轴,使两类样本在该轴上投影之间的距离尽可能远,而每一类样本的投影尽可能紧凑,从而使分类效果为最佳。 假设有两类样本,分别为$X_1$和$X_2$ 则各类在d维特征空间里的样本均值为: $$M_i = \frac{1}{n_i}\s 阅读全文
摘要:
D. Fun with Integers 题意: 给你一个n,对于任意的 2≤|a|,|b|≤n ,如果存在一个整数x,使得 $a*x=b$ 或者 $b*x=a$ ,那么a向b连一条边权为|x|的边。 问不经过重复的边最长的一条路径的长度。 思路: 我们发现这张图有欧拉回路,然后就把所有边权加起来就 阅读全文
摘要:
A. 模拟 B. 模拟 C. 分情况讨论 D. 权值线段树 E. DP(前缀和) F. DFS+贪心 阅读全文
摘要:
A: B: 给你两个数n和k,问有多少对(a,b) a<=n,b<=n,a≠b,使得a+b=k C: 给你一个括号序列,让你删点儿东西,变成长度为m的合法括号序列 D: 对于一个长度n的数组进行q次查询,i从1到q,第i次将任意一段连续的部分全部染成i。 最后得到的数组中可能会存在“污点”0.即最后 阅读全文