关于《博客园精华集》第一轮筛选的一点想法
很抱歉昨天晚上有重要安排,所以未能参加MSN会议,错过了与大家讨论的机会,看过聊天记录和团队博客里的会议记录,有下面这些想法:
1. 对于第一轮筛选的标准,如果要安全起见,第一轮标准应该放得尽量低,因为第一轮是每个人都要经手几乎所有分类的文章,但事实上不可能每个人都熟悉很多个分类,甚至有可能其中有些人对某一个或几个分类完全没有了解,这种情况下很容易造成误判,而且一般被误判的还都是文章比较少的分类(因为冷门所以不熟悉,因为熟悉所以误判),可能会造成一些小分类文章的严重短缺,因此,我建议第一轮标准尽量放低,基本可以按照包包的意思,第一轮中是去除非技术、转载、翻译,而不过多的对文章的质量等级作判别,这个任务留到第二轮分给各分册负责人,可以杜绝误判。
2. 关于去除转载,我感觉这是相当头疼的问题,很大一部分部分转载并不会标明是转载,所以这个判断就比较麻烦,一种可行的办法是利用搜索引擎,比如可以直接把标题复制到google、百度等几个搜索引擎中搜一下,一般值得转载而且有可能值得保留的文章,都可以搜索得到在网上的几份copy。问题也随之而来,一是工作量明显加大,二是无法对付连标题都修改的文章,三是如果搜出好几篇有时候并不很容易判断到底是谁在转载。
3. 去除翻译应该问题不大,一般有能力和时间翻译文章的,都会注明原文链接。
4. 关于dudu提供的文章列表(或者把这个放到那个筛选工具里),是否可以自动去除一些明显不可能有价值的文章?比如内容少于两百字,再有就是如果可以显示标题和一个摘要将会大大加快筛选进度。(因为昨天没在线,所以包建强发的图也没有收到,不知道这些是否已经提供了,如果已经提供,略过)
5. 对于任务分配,有两种原因会影响一个人的进度,一是运气超级好,50个博客大部分都是文章少而精,所以工作量小了(早期创建但后来不怎么用的博客里有一部分这种的),另一种原因就是这个人恰好比较闲,有足够的时间去做这些。与这两个相反的,任务量又大又没什么时间的,可能会很久弄不完,在这期间弄完的人又好像无事可做,所以这里应该存在一个任务再分配,前两天可以不管,一旦有人的工作进入尾声,那么就要开始监测各人的进度,如果有人剩余工作量过大,应该及时进行合理调配。把这个功能做到工具里?
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架