摘要: 1、BeautyREC 源图 I + 参考图 R =》带着 R 妆容的 I 第一行是提取R的整体风格,将它和 I 的特征做 QKV(long range dependencies),第二行是提取 I 的特征,然后 I 的 lip,skin,eyes 和 R的 lip,skin,eyes 特征(第三行 阅读全文
posted @ 2024-06-05 20:30 Jary霸 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 原核细胞和真核细胞的区别在于:有没有细胞核膜 植物细胞: 植物细胞与动物细胞的区别:叶绿体(质体),中央大液泡,细胞壁 原生质:枸成细胞的生活物质。原生质体包括细胞膜、细胞质和细胞核。 真核生物分为:植物,动物,真菌 植物分为:真核藻类,苔藓植物,蕨类植物,裸子植物,被子植物。共同特点是:都含有叶绿 阅读全文
posted @ 2024-03-31 16:35 Jary霸 阅读(29) 评论(0) 推荐(0) 编辑
摘要: 1、vlogger 与video Drafter 大致思路一样,不同点在于:考虑了较长时间的单个场景的生成,先根据主体图片(通过image cross attn)+文本以inpainting的方式生成clip,然后根据上一个clip的最后几帧以inpainting的方式生成下一个clip直到完成单个 阅读全文
posted @ 2024-01-29 16:43 Jary霸 阅读(46) 评论(0) 推荐(0) 编辑
摘要: 1、blip-diffusion 训练: 图片向量注入变为多模态向量注入:给概念“train” 和对应的5张照片,通过Blip(image encoder + multimudal encoder)得到5个subject prompt emb,然后取平均。原图的背景需要做随机替换以防止copy现象 阅读全文
posted @ 2023-10-20 08:52 Jary霸 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 1、Align your latent 改造2DUNET,把原来的每个层叫做spatial layer,当视频进来的时候就把时间维度映射到batchsize维度。为了让模型有时间概念,spatial layer 每层后面新增 temporal mixing layer,把空间层输出的结果(batch 阅读全文
posted @ 2023-07-28 17:35 Jary霸 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 0、prompt2prompt 动机:认为token对应的cross attn map 具备结构信息。方法:给一个初始的promp P,一个编辑后的prompt P*,初始的噪声一样,同时通过dm生成当前时刻的cross attn map :Mt,Mt*,然后根据Mt,Mt*和 P,P*生成 Mt~ 阅读全文
posted @ 2023-06-27 17:25 Jary霸 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 1、sota 取三元组:从常识性知识图谱中取去三元组:(head=事件1,relation=事件的关系,tail=事件2),比如Head: PersonX goes to an amusement park, Relation: xIntent, Tail: have fun riding attr 阅读全文
posted @ 2023-04-23 16:23 Jary霸 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 1、指标 假定 Feval(X)输出图片X的 id 特征向量,Fstyle(X)输出图片X的 风格 特征向量 Uniqueness:对于一堆图片,衡量图片里面有几个人,值记为 U;如果已知有C个人了,每个人分别有一堆照片,可以衡量人和人之间的像的程度,值记为 Uclass,值越小,说明这C个人越存在 阅读全文
posted @ 2023-04-22 23:40 Jary霸 阅读(29) 评论(0) 推荐(0) 编辑
摘要: Warmup:训练开始阶段,将学习率从0缓增到指定大小。目的:一开始学习率较小,模型先掌握大概收敛方向,明确方向之后,学习率就可以上升了 阅读全文
posted @ 2023-04-12 18:09 Jary霸 阅读(47) 评论(0) 推荐(0) 编辑
摘要: 1、 480x800 这样的图片是:横向 480 个像素、纵向 800 个像素 像素间距:一个2d像素实际长多少 体素间距:一个3d像素实际长多少 阅读全文
posted @ 2023-04-06 11:45 Jary霸 阅读(23) 评论(0) 推荐(0) 编辑