01 2020 档案

摘要:数据预处理 数据预处理是从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程;可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断。也可能,数据的质量不行,有噪声,有异常,有缺失,数据出错,量纲不一,有重复,数据是偏态,数据量太大或太小 主要表现: 阅读全文
posted @ 2020-01-22 23:09 Christbao 阅读(415) 评论(0) 推荐(0) 编辑
摘要:NLP 基本知识 NLP问题主要是对字词、短语、句子、篇章的处理,这一切问题主要包含两个层次:结构、语义。解决这些问题离不开两个基本概念:语言模型、序列标注。 一、语言模型 语言模型是指用数学的方法描述语言规律,统计语言模型是用句子A出现的概率p(a)来刻画句子的合理性,常用的有 n-gram模型 阅读全文
posted @ 2020-01-21 16:15 Christbao 阅读(1594) 评论(0) 推荐(0) 编辑
摘要:sudo + 其他命令:以系统管理者的身份执行指令,也就是说,经由 sudo 所执行的指令就好像是 root 亲自执行。 grep 要搜索的字符串 要搜索的文件 --color: 搜索命令,--color代表高亮显示 ps -ef/ps -aux: 这两个命令都是查看当前系统正在运行进程,两者的区别 阅读全文
posted @ 2020-01-17 15:45 Christbao 阅读(190) 评论(0) 推荐(0) 编辑
摘要:-rw-r--r-- 文件属性一共10个字符,第一个表示文件类型(-为二进制文件,d是文件夹,l是软连接文件) 剩余9个 rw- r-- r-- ,每三个为一组,第一组表示u (user)所有者的权限,第二组表示g (group)所属组的权限,第三组表示o (other)其他人的权限 (a指全部用户 阅读全文
posted @ 2020-01-17 14:45 Christbao 阅读(214) 评论(0) 推荐(0) 编辑
摘要:vi命令 vi命令是Unix操作系统通用的全屏幕纯文本编辑器,linux中vi编辑器称为vim,是vi的增强版(vi improved)。 vi编辑器支持编辑模式和命令模式,编辑模式可以完成文本的编辑功能,命令模式可以完成文件的操作命令。从编辑模式切换到命令模式使用‘Esc’键,从命令模式切换到编辑 阅读全文
posted @ 2020-01-17 13:43 Christbao 阅读(595) 评论(0) 推荐(0) 编辑
摘要:谷歌在2017年发表了一篇论文名字《Attention Is All You Need》,提出了一个基于attention的结构来处理序列模型相关的问题,比如机器翻译。传统的神经机器翻译大都是利用RNN或者CNN来作为encoder-decoder的模型基础,而谷歌最新的只基于Attention的T 阅读全文
posted @ 2020-01-16 14:50 Christbao 阅读(953) 评论(0) 推荐(0) 编辑
摘要:哈希表(hash)根据键(key)直接访问在内存存储位置的数据结构。通过计算关于键值的函数,将所需要查询的数据映射到表中一个位置来访问,提高查询速度。映射函数称为散列函数hash函数,存放记录的数组称为散列表。 把Key通过固定的算法函数(hash函数),转换成一个整型数字,对该数字的数组长度进行取 阅读全文
posted @ 2020-01-14 20:14 Christbao 阅读(249) 评论(0) 推荐(0) 编辑
摘要:2021/1/5 坚持自省,真知即意义 2020投资收益超30%,收益额达标67%;2021年投资收益30%。 2021年做到关注自身,重视获得真知,追求知识的乐趣,重新定义自己的边界 主题词:慢 慢慢慢慢慢慢慢慢慢慢慢慢 2020/8/12 榜样的力量 今早看到很早关注的一个大V已经荣升华为总监, 阅读全文
posted @ 2020-01-14 19:53 Christbao 阅读(157) 评论(1) 推荐(0) 编辑
摘要:条件随机场(Conditional Random Fields, 以下简称CRF)是给定一组输入序列条件下另一组输出序列的条件概率分布模型,在自然语言处理中得到了广泛应用。 HMM最大的缺点1》由于其输入独立性假设,导致不能考虑上下文特征,限制了特征的选择;2》在每一个节点都要进行归一化,所以只能找 阅读全文
posted @ 2020-01-14 19:37 Christbao 阅读(259) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示