posted @ 2023-03-07 15:43 蝈蝈俊 阅读(294) 评论(0) 推荐(0) 编辑
摘要:
大数据、人工智能、海难搜救、生物医学、邮件过滤,这些看起来彼此不相关的领域之间都会用到同一个数学公式:“贝叶斯公式”,它是如何来的呢?有啥用途?我们就来逐层讲解。 一、贝叶斯公式的由来 贝叶斯算法起源于解决逆向概率问题,18世纪时,由英国数学家托马斯·贝叶斯(Thomas Bayes,1702~17 阅读全文
摘要:
《联邦党人文集》 1787年5月,美国各州(当时为13个)代表在费城召开制宪会议;1787年9月,美国的宪法草案被分发到各州进行讨论。一批反对派以“反联邦主义者”为笔名,发表了大量文章对该草案提出批评。 宪法起草人之一亚历山大·汉密尔顿着急了,他找到曾任外交国务秘书(即后来的国务卿)的约翰·杰伊,以 阅读全文
posted @ 2023-03-06 21:32 蝈蝈俊 阅读(117) 评论(0) 推荐(0) 编辑
摘要:
作为当时美国海军大西洋舰队的19艘核动力攻击潜艇之一,排水量3000吨的天蝎号属于飞鱼级核潜艇。为了最大限度的提升水下速度,该艇采用了先进的泪滴形外壳,以33节(每小时61公里)的水下速度,成为当时美国海军最快的核潜艇。 1968年5月,美国海军的天蝎号核潜艇在大西洋亚速海海域突然失踪,潜艇和艇上的 阅读全文
posted @ 2023-03-06 21:01 蝈蝈俊 阅读(688) 评论(0) 推荐(0) 编辑
摘要:
在用matplotlib进行绘图时,如果在绘制过程中会用到中文,则默认情况下会出现字体警告: UserWarning: Glyph 36724 (\N{CJK UNIFIED IDEOGRAPH-8F74}) missing from current font. 警告信息中提示“missing fr 阅读全文
posted @ 2023-03-05 10:10 蝈蝈俊 阅读(1499) 评论(0) 推荐(0) 编辑
摘要:
提到token,不得不提tokenization(分词)。分词就是将句子、段落、文章这类型的长文本,分解为以字词(token)为单位的数据结构。 比方说,在句子 “我很开心” 中,利用中文分词得到的列表是{“我”,“很”,“开心”},列表中的每一个元素代表一个token。 不同的分词策略,会导致不同 阅读全文
posted @ 2023-03-04 07:48 蝈蝈俊 阅读(3933) 评论(0) 推荐(1) 编辑
摘要:
目的:跑通下面代码 相关代码 from torch import nn import torch import jieba import numpy as np raw_text = """越努力就越幸运""" words = list(jieba.cut(raw_text)) print(word 阅读全文
posted @ 2023-03-02 08:40 蝈蝈俊 阅读(33) 评论(0) 推荐(0) 编辑
摘要:
嵌入(Embedding)是用向量表示一个物体,这里所说的物体可以是人,是实体,是虚拟物品,比如:一个单词、一条语句、一个序列、一件商品、一个动作、一本书、一部电影、一个人等等。 可以说嵌入涉及机器学习、深度学习的绝大部分对象,这些对象是机器学习和深度学习中最基本、最常用、最重要的对象,正因如此,如 阅读全文
posted @ 2023-03-01 10:45 蝈蝈俊 阅读(2865) 评论(1) 推荐(0) 编辑
摘要:
在Encoder-Decoder模型框架我们提到: 不论输入和输出的语句长度是什么,中间的上下文向量长度都是固定的。 一旦长度过长,仅仅靠一个固定长度的上下文向量解码,会有信息瓶颈,可能会丢失信息的问题。 解决方法就是注意力机制。 在了解注意力机制之前,先请看《圣母与圣吉凡尼诺》这幅由佛罗伦萨画家多 阅读全文
posted @ 2023-02-26 20:02 蝈蝈俊 阅读(226) 评论(0) 推荐(0) 编辑