摘要: 这个应用看起来很像小学生写作文的场景,主要利用的还是多模态模型来实现的。 界面比较简单,根据上传图片对其进行描述。下面是一个简单的效果: 当然对于模型来说,它可能无法很好的区分性别。 其实现代码如下: import gradio def process(image, choice): .... de 阅读全文
posted @ 2025-04-06 15:39 月薪几千的牛马 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 可以使用gradio生成一个简单的检索机器人界面,当用户输入问题后经过检索后将最接近的3个选项的标题及内容显示出来。 其效果类似如下: 将相应的模型加载进来后,接收到用户输入的问题后将其进行嵌入并向量化后,经过召回和重排序后直接显示: 相应数据集来自百度知道,可以访问进行下载。 其相应界面代码如下: 阅读全文
posted @ 2025-04-04 21:44 月薪几千的牛马 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 以下是一些文本纠错数据集: shibing624/CSC,其中训练集有282万 另外还有文本生成模型textgen 阅读全文
posted @ 2025-04-04 16:40 月薪几千的牛马 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 访问https://pytorch.org/get-started/previous-versions/按照页面内容进行安装 而CUDA的历史版本为https://developer.nvidia.com/cuda-toolkit-archive 阅读全文
posted @ 2025-03-30 16:45 月薪几千的牛马 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 其实通过BERT模型对外卖数据集进行分类,从而得到其归类是好评还是差评。其中数据集使用的是waimai_10k。 该数据集中有1.1万条记录,其中差评占绝大多数。需要根据情况拆分为训练集和测试集。 主要考验对Transformers库的使用,就当是训练和学习。 如果不想训练,可以使用已经训练好的模型 阅读全文
posted @ 2025-03-29 16:11 月薪几千的牛马 阅读(5) 评论(0) 推荐(0) 编辑
摘要: HNSW是Hierarchical Navigable Small Worlds的缩写,其是一种基于图的数据结构,通过构建多层图从而实现高效的相似性搜索。其相关论文可以参考。 HNSW通过将数据组织成层次结构,每一层都包含由边连接的节点。顶层较为稀疏,可以在图中进行大范围的跳转。而下层密度增加,提供 阅读全文
posted @ 2025-03-28 17:49 月薪几千的牛马 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 这里要实现一个小小的界面,用于中文纠错。 相关代码如下: import gradio as gr def corrector(text): texts = text.split("\n") corrected_arr = 纠错函数(texts) #corrected_arr = [("今天新情很好" 阅读全文
posted @ 2025-03-28 14:13 月薪几千的牛马 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 最近想搞个视频自动嗅探的程序,用于检测视频中是否存在一些不良的内容。 下面介绍几个m3u8下载的工具: m3u8-downloader N_m3u8DL-CLI hs-m3u8 media-source-extract,通过插件的方式下载 最后是自己实现的一个效果,基于asyncio: 可以看到下载 阅读全文
posted @ 2025-03-27 19:14 月薪几千的牛马 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 这里通过gradio来生成1个图文理解的界面,通过上传一张图片,则生成相应文本描述,即望图生义。 import gradio def summarize(raw_image): model = xxxx() inputs = model.generate(raw_image) return toke 阅读全文
posted @ 2025-03-27 11:01 月薪几千的牛马 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 这里通过1个例子来看下微调的BERT与DeepSeek-R1:1.5b两种模型在阅读理解上的差异。 相关代码如下: def predict(doc, query): item = tokenizer.encode_plus(doc, query, max_length=512, padding="m 阅读全文
posted @ 2025-03-25 18:16 月薪几千的牛马 阅读(8) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示