NLP一篇文章的读书笔记
OOV(Out of Vocabulary)问题
NLP相对是应用科学,并不是特别的数学。但是我们天天用的算法的基本数学逻辑我认为还是需要搞懂,比如dropout, 比如天天用到的优化(SGD, momentum, adaboost, adagrad),比如各种 batch, layer normalization。这样其实可以省去很多浪费的时间,磨刀不误砍柴工。这些年来,在帮同学调bug的过程中,我至少遇见过3-5个同学 training 的时候开dropout, test 的时候没有对每个cell用 (1-dropout)去 scale (大家不要笑,这是真的)。然后画出dropout曲线就是 dropout 值越大,结果越差。在讨论的时候,同学一脸茫然并且不清楚test时候需要scale。其实本质就是并不了解dropout背后的数学原理。
NLP有很多子领域,MT,信息抽取,parsing,tagging,情感分析,MRC等等。
MT:Machine Translation
parsing:语法解析
POS tagging:词性标注(tagging)
MRC:Machine Reading Comprehension
参考:https://mp.weixin.qq.com/s/XiS0TJK7fhZTa5lzt3uQaQ
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
2018-02-15 剑指Offer - 不用加减乘除做加法
2018-02-15 剑指Offer - 求数组中重复的数字
2018-02-15 不错的题目 - 二叉搜索树改成双向链表
2018-02-15 剑指Offer - 翻转单词顺序列
2017-02-15 explicit的用法
2017-02-15 auto_ptr的使用和注意