摘要: 搜广推业务 信息检索 搜索、广告和推荐是很多互联网大厂赖以生存的命脉。比如,百度的搜索引擎、京东淘宝的推荐系统、腾讯的广告业务等。这一节我们就看看搜广推业务当中的自然语言处理方法。 1. 什么是信息检索 信息检索(Information Retrieval,IR)是指从大量的非结构化或半结构化数据中 阅读全文
posted @ 2025-02-16 22:06 白纸画卷水墨如冰 阅读(44) 评论(0) 推荐(0) 编辑
摘要: 5.1 大语言模型的使用 5.1.1 大语言模型的API调用与本地化部署 前面这么多NLP的任务、话题我们都是用网页版应用在测试,那我们怎么用代码调用大模型呢?最快的一个办法当然是用API调用了。首先,进入deepseek的API申请页面申请自己的API:https://platform.deeps 阅读全文
posted @ 2025-02-16 20:33 白纸画卷水墨如冰 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 4.1 对话与问答 4.1.1 问答系统 问答系统(Question Answering System,QA System)是人工智能与自然语言处理领域的重要研究方向,旨在通过计算机技术实现对人类自然语言提问的精准理解与高效响应。与传统的搜索引擎不同,问答系统不仅需要检索相关信息,还需对问题进行语义 阅读全文
posted @ 2025-02-15 22:43 白纸画卷水墨如冰 阅读(66) 评论(0) 推荐(0) 编辑
摘要: 3.1 文本分类 3.1.1 文本分类 文本分类任务其实我们应该是相对比较熟悉的。毕竟学习机器学习的第一课就是做分类任务嘛,把文本分成若干类。它和聚类还有些不同的地方,这个我们后面会讲。那分类把文本能分成哪几类呢?比如,邮箱可以把邮件分成正常邮件和垃圾邮件;新闻会把文章分区为体育/娱乐/政治/经济/ 阅读全文
posted @ 2025-02-15 20:27 白纸画卷水墨如冰 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 2.1 语言模型 2.1.1 语言是可计算的 第一章里面我们讲了语言的分析要素。很多东西其实还是传统语言学里面的定义,只不过我们通过一些案例比如CRF、文法等内容给大家展示了语言是可以被数学建模的。那么,这种低层级的语法解析是如何与高等级的对话式大模型联系起来的呢?这种层级的数学建模显然不能让机器充 阅读全文
posted @ 2025-02-15 14:58 白纸画卷水墨如冰 阅读(267) 评论(0) 推荐(1) 编辑
摘要: 1.1 语言的基本组成要素——词汇 1.1.1 语言的组成要素 无论是人类学习语言,还是让机器学习人类语言,在面对一门语言时,我们总是先记住一些常用词,然后是语法和基本句型,再然后结合到具体的篇章、对话的语境中学习。可以说,语言是由字符、词汇、语法、语义、语境等多个元素相互作用的结果。如果聚焦到某个 阅读全文
posted @ 2025-02-14 20:26 白纸画卷水墨如冰 阅读(371) 评论(0) 推荐(1) 编辑
摘要: 最近刚好是在写智能信息安全的教程,最后一章准备讲内容安全,里面有一节探讨大模型安全的内容,刚好可以拿比赛的内容当案例。 首先,可以通过modelscope平台获得GPU使用权限。然后你就可以跑baseline了 我这里试着跑了一下,如果是GPU版本就比较流畅,CPU会被卡死。但是呢,一天就只能提交一 阅读全文
posted @ 2024-10-12 23:45 白纸画卷水墨如冰 阅读(22) 评论(0) 推荐(0) 编辑
摘要: 讲解一下C语言内存空间的模型: 代码区:它是用来存放程序执行代码的一块内存区域。通常,这部分区域是只读的,防止程序意外地修改了它的指令。 常量区:数据段包含了程序中已初始化的全局变量和静态变量。而BSS段包含了程序中未初始化的全局变量和静态变量,这部分在程序开始执行前通常会被操作系统清零。 堆区:堆 阅读全文
posted @ 2024-04-07 21:41 白纸画卷水墨如冰 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 编译原理 一个C语言程序跑起来的过程是怎样的? 预处理:在这一步,预处理器(如gcc -E)处理源文件中的预处理器指令,如#include、#define等。 编译:编译器(如gcc -S)将预处理后的代码转换为汇编语言。这一步包括词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成。 阅读全文
posted @ 2024-03-30 22:22 白纸画卷水墨如冰 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 计算机网络 以OSI体系为例讲解计算机网络的各层协议及作用? 七层网络体系结构各层的主要功能: 应用层:为应用程序提供交互服务。在互联网中的应用层协议很多,如域名系统DNS,支持万维网应用的HTTP协议,支持电子邮件的SMTP协议等。 表示层:主要负责数据格式的转换,如加密解密、转换翻译、压缩解压缩 阅读全文
posted @ 2024-03-24 21:28 白纸画卷水墨如冰 阅读(40) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示