04 2025 档案

摘要:作为五一前最后一篇文章,说点有用的东西。关于抠图,实际上这玩意都是老生常谈的,没什么创新的地方,目的自然是将其中的人物或事物从背景中分离出来。 关于BackgroundMattingV2抠图,实际上要求蛮高的,要求2张图片的尺寸要一致,而且需要均包含相同的事物。相关的项目可以参考,相关的模型可以点击 阅读全文
posted @ 2025-04-30 19:27 月薪几千的牛马 阅读(45) 评论(0) 推荐(0)
摘要:其实关于MLops有什么用,实际上这个话题对很多人来说并没有什么用处,因为AI只是一小撮人做的事情。如果全社会都AI化,可以说不是效率的提升而是社会的混乱。 AI这东西只会为了将一些繁琐的事情让渡给机器去做,从而减轻人们的工作强度,从而更专注其他事情。毕竟它让很多事情门槛又有所降低。 而MLops可 阅读全文
posted @ 2025-04-28 07:42 月薪几千的牛马 阅读(6) 评论(0) 推荐(0)
摘要:关于该公司,直接上某乎上看看就知道了,我就不多说了。 公司位置一般,但是在市区内,是双休的,岗位比较偏向基础。面试我的是个靓女,先进行自我介绍,然后根据你简历中提问。实际上也没问什么有深度的东西,感觉很多她也并不是很懂。 环境一般般,需要刷脸才能进去公司技术部门,搞得有什么重要机密一样。而且大字貌似 阅读全文
posted @ 2025-04-27 21:10 月薪几千的牛马 阅读(5) 评论(0) 推荐(0)
摘要:本文主要是在深度学习中自己的一些疑惑,从这些问题中从而更好理解其中的原理。学习的过程就是提出问题,然后解决问题,而交互式大模型正好很适合自我驱动的学习。 为何需要卷积网络 答:传统神经网络中每个神经元都要进行全连接,从而大量权重。而卷积神经网络利用局部感知概念,即图像中邻近区域的相关性,参数量小很多 阅读全文
posted @ 2025-04-26 10:49 月薪几千的牛马 阅读(4) 评论(0) 推荐(0)
摘要:原文地址: https://zhuzhulang.github.io/blog/posts/how-to-use-paddleocr-recognition-table/ 如果非要说什么的话,那就是用OCR来识别文件内容其实是把问题复杂化的表现,但是应用场景还是有那么一些,比如古籍的扫描后文字的识别 阅读全文
posted @ 2025-04-22 11:46 月薪几千的牛马 阅读(283) 评论(0) 推荐(0)
摘要:今天讲点干货的东西,关于numpy中轴操作(axes)的内容。 在numpy中有些函数支持axes参数,比如max、min、mean等,关于其轴的处理可能很容易给人感觉云里雾里的,毕竟高维之后还真不好确定。 这里先以一个简单例子进行说明: >>> import numpy as np >>> np. 阅读全文
posted @ 2025-04-21 21:52 月薪几千的牛马 阅读(15) 评论(0) 推荐(0)
摘要:kubernetes工具实际上难度并不是很高,只是有些概念理解不到位会导致看得云里雾里。 这里使用minikube快速搭建一个Kubernetes环境。 首先下载相应的软件: root@vbox:/home/vboxuser# install minikube-linux-amd64 /usr/lo 阅读全文
posted @ 2025-04-18 14:09 月薪几千的牛马 阅读(7) 评论(0) 推荐(0)
摘要:实际上关于该公司的面试,怎么说呢?就当是练手,不要太指望能进去。 比较好笑的是,连我应聘什么岗位都不知道,莫非还能一个技术人员当多个岗位面试官不成。而且面试全程连对方张什么样看不见,却要你开摄像头,给人一种没有什么诚意的感觉。 该公司是主动找我,结果要求发简历和期望薪资后就过了一个星期才说通过初试。 阅读全文
posted @ 2025-04-17 15:41 月薪几千的牛马 阅读(24) 评论(0) 推荐(0)
摘要:关于多码同屏的检测,实际上并不难。只是一般的二维码检测工具可能不支持倾斜的检测。对此,需要进行一些预处理工作,将其校正后再进行检测。 比如下面的二维码摆台: 此时要做的事情就是检测图中的二维码的位置,可以使用的方法也比较多,比如YOLO、OpenCV等。 我们的目标是做到如下的效果: 得到对应的位置 阅读全文
posted @ 2025-04-15 15:51 月薪几千的牛马 阅读(7) 评论(0) 推荐(0)
摘要:关于这家公司的内容比较少,就当是记录。 首先这家公司是初创公司,初创自然福利和成本压缩的就比较厉害。当时投了这家公司简历,前一天晚上找我要简历,结果第二天就直接要电话了。妥妥的是那种招不到人的节奏。 本以为这个公司的英文是AiBot,即AI机器人。没想到是AIBERT,是AI BERT。 而且突然就 阅读全文
posted @ 2025-04-12 14:14 月薪几千的牛马 阅读(13) 评论(0) 推荐(0)
摘要:封神榜 阅读全文
posted @ 2025-04-11 19:01 月薪几千的牛马 阅读(3) 评论(0) 推荐(0)
摘要:Chinese-FastSpeech2 RVC ChatTTS-Forge YourTTS KAN-TTS 参考文章: https://zhuanlan.zhihu.com/p/14905368439 https://mp.weixin.qq.com/s?__biz=MzUyNDgyNTg2Ng== 阅读全文
posted @ 2025-04-11 17:30 月薪几千的牛马 阅读(9) 评论(0) 推荐(0)
摘要:这里介绍如何在本地搭建MongoDB的副片集。首先创建3个目录: mkdir rs0 rs1 rs2 然后启动3个终端各自进行相应的服务: mongod --port 27017 --dbpath ../rs0 --replSet rs0 mongod --port 27018 --dbpath . 阅读全文
posted @ 2025-04-09 13:09 月薪几千的牛马 阅读(5) 评论(0) 推荐(0)
摘要:可以通过生成式问答机器人解决一些业务中的问答问题,但是一般采用小模型生成的结果都需要再进行一些润色才能达到更好的效果。 这里问答使用mxmax/Chinese_Chat_T5_Base模型,而润色则使用RichardErkhov/IDEA-CCNL_-_Wenzhong-GPT2-110M-4bit 阅读全文
posted @ 2025-04-09 09:58 月薪几千的牛马 阅读(25) 评论(0) 推荐(0)
摘要:Swanlab是一个简单易用的工具,可用于模型微调过程中对其训练数据进行记录。借助这个工具,可以简化训练数据的记录。 其调用方法类似如下: import swanlab # 登录到平台 swanlab.login(api_key="...") run = swanlab.init( project= 阅读全文
posted @ 2025-04-08 18:38 月薪几千的牛马 阅读(57) 评论(0) 推荐(0)
摘要:列举一些关于提示词学习的文章: Prompt Learning 超强入门教程 简单了解prompt learning是什么? 【P-Tuning】 一种自动学习 prompt pattern 的方法(附源码) 阅读全文
posted @ 2025-04-08 15:58 月薪几千的牛马 阅读(5) 评论(0) 推荐(0)
摘要:下面推荐一些数据标注工具: doccano,适合文本分类、序列标注及序列到序列的任务 阅读全文
posted @ 2025-04-08 15:26 月薪几千的牛马 阅读(18) 评论(0) 推荐(0)
摘要:这个应用看起来很像小学生写作文的场景,主要利用的还是多模态模型来实现的。 界面比较简单,根据上传图片对其进行描述。下面是一个简单的效果: 当然对于模型来说,它可能无法很好的区分性别。 其实现代码如下: import gradio def process(image, choice): .... de 阅读全文
posted @ 2025-04-06 15:39 月薪几千的牛马 阅读(17) 评论(0) 推荐(0)
摘要:可以使用gradio生成一个简单的检索机器人界面,当用户输入问题后经过检索后将最接近的3个选项的标题及内容显示出来。 其效果类似如下: 将相应的模型加载进来后,接收到用户输入的问题后将其进行嵌入并向量化后,经过召回和重排序后直接显示: 相应数据集来自百度知道,可以访问进行下载。 其相应界面代码如下: 阅读全文
posted @ 2025-04-04 21:44 月薪几千的牛马 阅读(24) 评论(0) 推荐(0)
摘要:以下是一些文本纠错数据集: shibing624/CSC,其中训练集有282万 另外还有文本生成模型textgen 阅读全文
posted @ 2025-04-04 16:40 月薪几千的牛马 阅读(41) 评论(0) 推荐(0)