往前看,别回头——2023个人年终总结
2023年终总结
赶着昨晚回家前,把最后一个commit提交完,终于也又到一年之末了。
这一年来,是一路小跑冲到终点的快节奏,也是步履不停的一路前行;
行至当途,也是到了该停下来好好沉淀思考的时候了;
还记得也是去年年终的时候,开始陆续收到了一些猎头的邀约,BOSS直聘上也不乏一些推荐;
本着看一看机会的想法,也抱着试一试看看目前算法岗市场行情的心态,陆续也接受了这些邀约,
按照既定的时间去一一面试,有些有结果,有些没有下文了,但总体上结果还是好的;
最后的结果,是在今年二月份的时候,收到了鹅厂youtu算法岗base厦门的offer,终于尘埃落定。
至于之前做的机器人相关的算法研发,算起来从毕业至今,也摸索了三四年之久了,这期间虽然也学到了不少经验,也做出了一些东西,但距离预期的目标还是有着不小差距,大概也是实际去了各种场景现场,尝试用算法解决问题,遇到不少现实意义中的阻力与问题之后,最后综合得出的结论吧;可能是,自己的水平还不够,不足以支撑现有场景与问题中的需求实现;又或者是,对于AGI的能够快速到来,不是特别有信心;具体原因,不必过度纠结,往前看,别回头。
但无论怎么样,能够去更高更宽广的平台,学习与发挥自己所长,与我而言,也是极好的选择。
至于心情,虽然现在很平静的看待,但当时的感受大概就是,像当天发pyq的心迹,虽迟但到,总是好的 ,所幸不会太晚。
往前看,别回头
试用期
在之前的公司走完离职流程之后,三月份开始正式入职yt。
入职当天正好是妇女节,因此记忆深刻的是入职当天,由于此前并没有yt的人入职这里,办理入职手续与流程的时候也是几番周折,然后是快速的熟悉新的环境,熟悉工作流程,跟mentor确定试用期目标,及时调整了自己的生活作息,然后适应新的工作节奏,还有随着成长进度日益增长的工作强度;(或许已经是预见到之后的内卷节奏,在开始做铺垫了,笑😊)
生活上,又重新从岛外的家里搬出来,在思明的公司附近重新租住了一个小公寓,与公司通勤3-5分钟步行时间,也是为了保证更充足的睡眠时间,还有能够保证工作加班的时间吧。
说来侥幸,能够入职已是幸运,因此不免觉得时时有着不小的压力,以本科工作几年经验,社招入职的我,与实验室动辄名校硕博和留学海归的佬们比起来,仍旧还是资历尚浅的,毕竟没有系统的受过研究生正规的学术训练与教育,在前沿知识领域的探索与认知上,仍然是存在着不小的差距;但好在自己一直以来,动手与实践的比较多,想到就马上去做,坚持了很久苦行僧般自律清修的生活,一边在完成试用期任务的同时,也一边在恶补自己潜在的知识漏洞和不足,算是作为自己实践的理论支持吧。就这样持续坚持渡过了三个多月,才算是堪堪能够承担起来现在的工作。
这里得尤其🙏感谢ke总,yulei哥等实验室众多小伙伴的帮助与支持,试用期的工作主要是:
- 完成了一些数据与数据集上的一些梳理与探索;
- 尝试了华为昇腾Ascend在npu上训练推理的验证性工作,
- 尝试了弱监督伪标签中重新分类修正,提高预测分类准确率和数据集质量;
- 负责了一些业务模型上的增量数据迭代以及算法实验对照优化;
正式期
完成了试用期工作之后,结合目标完成情况,做了一个简单的答辩汇报,就算是正式转为正式员工啦。
业务上,也开始承担更多的责任,接到了更多的任务,业务上与研究上的都有;业务上开始慢慢承接更多场景下识别算法相关的sdk维护与迭代,同时研究上也参与了一些MLLM多模态大模型相关的探索,对接一些相关场景下的算法需求,支持更多算法,就算是一个日常的工作了。虽然走的很艰难,但也算是成长地比较快吧,从实验室很多伙伴身上都有学习到一些东西,这里得感谢peixian还有chaoyou哥等许多帮助,在业务和研究上,拔高了一些水平,也打开了不少眼界,见识到真正sota的算法,应该是什么样的。
在那些最难坚持的阶段,都是他们一起帮忙和教导下,才平稳的渡过去,极大地助力了个人的成长。
就像是一个未封口,瓶颈还能一直向上拉伸的容器,每次到了自己觉得自己承载不下去的时候,靠谱的伙伴们给你兜了底,于是瓶口又上延伸了一些,容器底部也溢出了不少杂质;这些拉扯与拉伸的过程,不免是痛苦的,经历过怀疑自己,质疑意义的至暗时刻,好在总有一些光,能够从容器的瓶口照射进来,因此便有了阳光雨露。
人言君子不器,又道有容乃大,大抵如此。
快乐开源
除此之外,今年也接着去年的工作,提交了不少commit,开源了一些工作:
-
有跟学术相关的,针对模型评估绘图的:
https://github.com/isLinXu/model-metrics-plot -
有跟大模型prompt学习相关的:
https://github.com/isLinXu/model-metrics-plot -
有跟模型推理UI相关的:
https://github.com/isLinXu/vision-process-webui -
有跟模型探索相关的:
https://github.com/isLinXu/onnx-explorer -
也有跟业务和yolo目标检测相关的:
https://github.com/isLinXu/YOLOv8_Efficient -
以及学习路线图整理的:
-
用chatgpt回答知乎问题的,答案之书:
-
... ...
以上,开源与技术交流学习,仍然是今年比较重要的主题。
有一些是一边学,一边沉淀下来的积累,也有一些探索性的“整活”;
在此过程中,更多的是,在做中学,和在学中去做。
为此,开源已经成为了一个日常的爱好与习惯了,比如每天用GitHub来更新daily的日记,替代了之前用的印象笔记,这里也更加熟练了markdown的写法;
另外在工作研究上,也一直在维护更新多模态评测相关的MME榜单,目前已经更新到40+的多模态模型了;
技术弄潮儿
另一方面,由于ChatGPT的技术突破和影响下,自己也开始慢慢意识到继续走纯CV计算机视觉的方向,必然是不长久的,于是开始逐渐拥抱nlp以及llm大语言模型的学习与使用,尤其是多模态相关的研究与应用,已经成为了目前个人感兴趣且在研究的重点。受流浪地球2的影响,也越来越明确想要做AI架构师这一目标的信念,毕竟在电子骨灰盒里机械飞升确实是一件很酷的事情。
同时,也在入职后不久,为了不与公司的资源冲突混淆,冲动下单,搭建了一台自己的服务器4090主机,
为了激励自己成为AI架构师,也是致敬经典,给自己的机器命名为550w,虽然跟电影中的原型机还距离比较遥远,
但还是希望,自己可以一直沿着一条路走下来,能够坚持到真正的AGI出现的那天吧。
机子的详细配置清单,可见这个链接:【开发配置】配置一台4090主力开发机的完全过程手册,
虽然最后整个机子搭下来,有点超出预算;但最后4090的大幅涨价,证明还是有一点先见之明的。
在这台新搭建的机子上,也跑通了不少llm模型的推理,包含llama.cpp等一些量化后的模型,但仍受限于算力资源的配置,无法直接进行fine-tune;
llm在一定程度上,确实提高了在编码以及debug排查问题方面的能力,甚至在程序代码和脚本封装优化上,效果也是不错的;
事实证明,4090上几乎可以跑通65B以下的大多数的模型推理,在端侧也尝试了百度文心一言、讯飞星火、天工助手和智谱、通义千问等一些移动端应用,也做了大量的测试,虽然和正版ChatGPT还是有着不小的差距,但国内能替代部分功能平替就可以了,实在不行就组合起来用(又不是不能用,要什么自行车,笑😊~)
除了自己搭建的4090主机,为了部署与验证更多模型的性能,在去年搭建的小箱子上,也新入手了一些板子和设备,成为了一个用着还算顺手的AI模型部署实验平台:
尤其是今年也新出了一些性能稳定,算力可以发挥很好的设备,比如爱芯元智新出的AX650已经可以很好的运行端侧的transformer模型了,甚至在自动驾驶和BEV上也得到了应用。
另一方面,今年也是AIGC爆发的一年,生文、生图、生视频,在很多方面上的效果,已经超过了很多人的预期表现。
工作之余,自己也跟着瞎折腾,整了一点活,虽然还没有正式发布,但也算是学习了一些相关的知识了;
效果大致是下面这样的,
此外,今年也见证了很多AI的“历史性”时刻,比如OpenAI的“宫斗”,SAM(segment anything),dragGAN等一系列的工作,有些其实真的是很简单粗暴的想法和动机,但是大力出奇迹的事实也不断被得到验证,这些新出来的开创性技术,确实也极大地启发了国内很多小伙伴的想法和灵感,也跟着一些小伙伴们,接着以上这些工作,继续做了一些扩展与优化。
总而言之,今年是技术爆炸,信息量递增的一年,经常有小伙伴会说,看论文都看不过来了,后来是改成了看一些AI社区和资讯群里的信息,再到后来,连AI简讯都有点应接不暇了;因此,有时候面对这种情况,也有过浮躁和想要摆烂的想法,反正都学不过来,而且实际应用上,前沿技术的落地跟发展还是有着一段时间的差距,才会平稳的过渡到普罗大众周围,然后慢慢被接受。
但事实上,技术的更新,与科技的发展,只能不断地去学习,否则就如逆水行舟,不进则退;特别是现在技术爆炸的时代,这种感觉更为明显;当然,我也知道,不能一昧地去追求技术,更不能理想主义的,把技术作为理想,那确实不太现实。
有听过这么一句话,原话大概已经记不清了,大意是:技术对于一些人来说是理想,是信仰,但对于另外一些人而言,技术是实现某些目的跳板或者基础。
私以为这两种人对于技术的追求显然是不同的,对于科学技术,有一部分人,把它视为理想和高山,会去不断的攀登;另外一些人,会将那些高山作为目的地,为了达到这个其他的目的,通过各种方式去攀爬,以期望一览众山小;其余的更多人,则是在山脚下去仰望。
于我而言,先是在山脚下高山仰止,后来是不断地去摸索从哪去上山的途径,最后是一步一步的攀爬,行至中途,才发现原来已经走了那么远的路,而且向上看,还有更多的路和高度,需要去突破和发展。
在此过程中,也得到了一些算不上里程碑,且微不足道的荣誉,对我来说,都是一种激励:
一些生活
除了工作与日常的生活,也开始重视健康与运动,因为长期久坐和盯着电脑屏幕,缺乏运动,今年在小伙伴的影响下,开始去骑行与跑步,也开始学着正确的健身,也希望可以让自己变得更好吧。
今年五一也带家里去外面露营,然后国庆与友人一同去了一些地方旅行散心,这里简单地记录一下,想起来都是美好的回忆和片段。
也希望与自己同行的人,新的一年都可以更加顺利吧。
梯度下降是一种在函数空间中寻找最小值的优化算法,它的基本思想是在当前位置,寻找函数值下降最快的方向,然后沿着这个方向前进一步,然后再在新的位置重复这个过程,直到找到函数的最小值。
在人生发展的过程中,我们可以把这个过程看作是一个优化问题,我们的目标是要使我们的生活质量、事业发展等达到最优。
在此过程中,我们需要不断地尝试,不断地学习,不断地改进,这就像是在函数空间中寻找最小值的过程。
我们在人生的路上会遇到各种各样的问题,这些问题就像是函数的局部最小值,我们需要通过不断的尝试和学习,找到解决问题的方法,这就像是梯度下降算法中的一步步前进。
同时,我们也需要有一个明确的目标,这个目标就像是函数的全局最小值,我们需要不断地努力,不断地优化,才能达到这个目标。
因此,梯度下降的思想告诉我们,在人生的路上,我们需要有明确的目标,需要不断地学习和尝试,需要有解决问题的勇气和毅力,只有这样,我们才能不断地优化我们的人生,达到我们的目标。
总结大致为以上,也没有更多啦,笔力不够,难免显得啰嗦。
最后是给大家的新年祝福。
祝大家都能不断精进,升职加薪,所有的代码都能顺利编译,所有的bug都能被找出并修复,所有的功能都能按时完成。
在这个新的一年里,希望大家都技术能够更上一层楼,项目能够一路绿灯,工作能够顺利进行,生活能够如你所愿。
能够像龙一样,无论在什么环境下,都能适应并且发挥出自己的能力,无论遇到什么问题,都能冷静应对并且找到解决的方法。
一切都能如你所愿,一切都能顺利,一切都能美好。
新年快乐,万事如意!
写于2023年12.31。
记于厦门。