《统计自然语言处理(第2版)》读书笔记
序(摘要)
NLP = linguistics + math + computer science + 认知科学 + 逻辑学 + 心理学
International Tech 评测:
- 机器翻译
- 信息抽取
- 句法分析
中文信息处理:
- 生词识别、歧义消解(共性)
- 韩语自动分词、词性定义规范(个性)
math:
- algebra
- probability
NLP 理论体系尚未真正建立,技术方法仍十分初步!
理论:
- 形式语言与自动机
- 语言模型
- 隐马尔可夫模型
方法:
- 汉语自动分词
- 句法分析
- 词意消歧
应用:
- 统计机器翻译
- 语言翻译
- 信息检索
- 文本分类
- 口语信息处理
基础:
- 概率论
- 信息论
- 形式语言
- 自动机
基于统计的自然语言处理 => 经验主义
基于规则的自然语言处理 => 理性主义
基于统计的 NLP 方法:
- 隐马尔可夫模型
- 最大熵模型
- n元语法
- 概率上下文无关
- 噪声信道理论
- 贝叶斯方法
- 最小编辑距离
- viterbi算法
- 搜索
- 双向搜索
- 加权自动机
- SVM
语义是否可计算?计算模型、方法、复杂度?
智慧在街市上呼喊,在宽阔处发声。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)