fariver

2025年10月25日

[PaperReading] Qwen2.5-VL Technical Report

摘要：目录Qwen2.5-VL Technical ReportTL;DRMethodFast and Efficient Vision EncoderMRoPE对齐绝对时间信息Pre-TrainingInterleaved Image-Text DataGrounding Data with Absol 阅读全文

posted @ 2025-10-25 17:16 fariver 阅读(99) 评论(0) 推荐(0)

2025年10月21日

[PaperReading] DeepSeek-OCR: Contexts Optical Compression

摘要：目录DeepSeek-OCR: Contexts Optical CompressionTL;DRMethodDeepEncoderDeepDecoderDataExperiment总结与思考相关链接 DeepSeek-OCR: Contexts Optical Compression link 时阅读全文

posted @ 2025-10-21 22:49 fariver 阅读(83) 评论(0) 推荐(0)

2025年10月18日

[PaperReading] SAIL-Embedding Technical Report: Omni-modal Embedding Foundation Model

摘要：目录SAIL-Embedding Technical Report: Omni-modal Embedding Foundation ModelTL;DRDataRecommendation-aware Data ConstructionDynamic Hard Negative MiningQ：动阅读全文

posted @ 2025-10-18 18:20 fariver 阅读(88) 评论(0) 推荐(0)

2025年10月17日

[PaperReading] VLM2Vec-V2: Advancing Multimodal Embedding for Videos, Images, and Visual Documents

摘要：目录VLM2Vec-V2: Advancing Multimodal Embedding for Videos, Images, and Visual DocumentsTL;DRMethodQ：VLM2Vec-V2与原始VLM2Vec算法有什么区别？BenchmarkQ&AQ：CLS, QA, R 阅读全文

posted @ 2025-10-17 19:51 fariver 阅读(73) 评论(0) 推荐(0)

2025年10月16日

[PaperReading] VLM2VEC: TRAINING VISION-LANGUAGE MODELS FOR MASSIVE MULTIMODAL EMBEDDING TASKS

摘要：目录VLM2VEC: TRAINING VISION-LANGUAGE MODELS FOR MASSIVE MULTIMODAL EMBEDDING TASKSTL;DRMethodDatasetExperimentQ&AQ：VLM2Vec与普通VLM有什么区别？难道仅仅是会将embedding存阅读全文

posted @ 2025-10-16 22:37 fariver 阅读(149) 评论(0) 推荐(0)

2025年9月26日

[PaperReading] REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS

摘要：目录REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELSTL;DRMethod实验设计不同方法的对比BadCase分析Q&AExperimentWebShop总结与思考相关链接 REACT: SYNERGIZING REASONIN 阅读全文

posted @ 2025-09-26 13:48 fariver 阅读(88) 评论(0) 推荐(0)

2025年9月23日

[PaperReading] MemGPT: Towards LLMs as Operating Systems

摘要：目录MemGPT: Towards LLMs as Operating SystemsTL;DRMethodMain contextExperiment总结与思考相关链接 MemGPT: Towards LLMs as Operating Systems link 时间：23.10 单位：UC Be 阅读全文

posted @ 2025-09-23 18:29 fariver 阅读(79) 评论(0) 推荐(0)

[PaperReading] Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution

摘要：目录Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any ResolutionTL;DRMethodNaive Dynamic ResolutionMultimodal Rotary Position E 阅读全文

posted @ 2025-09-23 18:29 fariver 阅读(86) 评论(0) 推荐(0)

2025年9月22日

[PaperReading] Mind Search: Mimicking Human Minds Elicits Deep AI Searcher

摘要：目录MindSearch: Mimicking Human Minds Elicits Deep AI SearcherTL;DRMethodOverall FrameworkWebPlannerWebSearcher关键步骤Experiment总结与思考相关链接 MindSearch: Mimic 阅读全文

posted @ 2025-09-22 21:19 fariver 阅读(36) 评论(0) 推荐(0)

[PaperReading] METAGPT: META PROGRAMMING FOR A MULTI-AGENT COLLABORATIVE FRAMEWORK

摘要：目录METAGPT: META PROGRAMMING FOR A MULTI-AGENT COLLABORATIVE FRAMEWORKTL;DRMethodExperimentHumanEvalMBPP效果可视化总结与思考相关链接 METAGPT: META PROGRAMMING FOR A 阅读全文

posted @ 2025-09-22 20:30 fariver 阅读(102) 评论(0) 推荐(0)

公告