随笔分类 -  自然语言处理

摘要:Skip-gram基本思想 根据中心词来预测上下文。 Skip-gram计算方法 采用滑动窗口机制,窗口中心为中心词w,根据中心词w推断窗口内其他词,也就是上下文词c。 假设有单词序列:“鸡你太美”,窗口大小win为2,也就是取中心词左右两边的一个单词。 则根据中心词预测上下文的概率为:P(你|鸡) 阅读全文
posted @ 2023-03-30 10:43 Laplace蒜子 编辑
摘要:马尔科夫模型 二阶马尔科夫模型案例 初始概率分布 状态转移概率分布 状态集合 状态集合S={sunny,cloudy,rainy}。 观测序列 观测状态序列可以是X=x1,...,xt,...,xT,其中xt∈S。 观测序列就是一个系列的状态。马尔科夫模型在计算状态序列的概率时,考虑了转移概率,也就 阅读全文
posted @ 2023-02-20 17:50 Laplace蒜子 阅读(305) 评论(0) 推荐(0) 编辑
摘要:1 自然语言的特点 线性:⾃然语⾔呈现为⼀种线性的符号序列。 层次性:⾃然语⾔内部存在层次结构。 歧义性:同⼀个⾃然语⾔句⼦存在多种不同的理解。 演化性:⾃然语⾔随着时代不断演化。 2 自然语言的典型任务 2.1 中文分词 输入:⼀段不带空格的汉语⽂本。 输出:以空格隔开词语的汉语⽂本。 高效的中文 阅读全文
posted @ 2023-02-20 14:15 Laplace蒜子 阅读(34) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示