摘要: 数据降维 数据降维在机器学习中非常有用,可以用来舍弃数据中一些区分度较小的特征,转化数据的观察视角,使其在更少量的特征维度上也有较好的表现。数据降维也可以用在将高维数据可视化的操作中,这都是不可或缺的重要算法, PCA PCA(Principal Components Analysis)主成分分析法 阅读全文
posted @ 2020-04-18 18:27 TABball 阅读(406) 评论(0) 推荐(0) 编辑
摘要: 世界上有这么多 word embedding,都有啥区别啊?ELMO,BERT这都是啥? "李宏毅老师 YouTube 课程" 为什么要 Embedding one hot 编码占据大量的运算空间,基本都是0,空间利用率很低,且运算速度很慢 不能充分表现词与词之间的联系,one hot 表现出的词都 阅读全文
posted @ 2020-04-18 18:26 TABball 阅读(217) 评论(0) 推荐(0) 编辑
摘要: `Vocabulary`是包含字或词与index的关系的类,用于将文本转化为index。 "教程地址" 构建Vocabulary python from fastNLP import Vocabulary vocab = Vocabulary() vocab.add_word_lst(['复', ' 阅读全文
posted @ 2020-04-18 18:24 TABball 阅读(889) 评论(0) 推荐(0) 编辑
摘要: 前言 看论文 "TENER: Adapting Transformer Encoder for Named Entity Recognition" 的实现,发现不了解fastNLP看起来挺费劲,而且这一套好像也挺好用,有必要学一下,特此做fastNLP学习笔记。 "原官方中文教程在这里。" 这一章是 阅读全文
posted @ 2020-04-18 18:23 TABball 阅读(525) 评论(0) 推荐(0) 编辑
摘要: "Structured Learning 4: Sequence Labeling on YouTube" 序列标注是一种在NLP中很基础但是也很重要的任务。以POS词性标注为例,输入是一个句子,输出是每个单词的词性。 如果每个单词只有一种词性,我们可以简单的做一个hash table,读到单词直接 阅读全文
posted @ 2020-04-18 18:19 TABball 阅读(1157) 评论(0) 推荐(0) 编辑
摘要: Feature Scaling 假设我们现在训练的模型有很多特征,我们现在训练的网络长下面这个样子: $$ z = activate(x_1 W_1 + x_2 W_2 + bias) $$ 其中$x_1,x_2$的数据级别差的比较多,比如一个在100左右,一个在0到1之间,那么两个权重矩阵对最后结 阅读全文
posted @ 2020-04-18 18:10 TABball 阅读(223) 评论(0) 推荐(0) 编辑
摘要: What is TRANSFORMER? 今天学一下~~变形金刚~~,transformer是一个很有用的模型,尤其会为我们后面学习 "BERT model" 打好基础。文章如有不当之处,请不吝赐教。下面来看一下这个神奇的工具吧。 李宏毅老师transformer课程:https://www.you 阅读全文
posted @ 2020-04-18 17:59 TABball 阅读(655) 评论(0) 推荐(0) 编辑
摘要: NLP FROM SCRATCH: TRANSLATION WITH A SEQUENCE TO SEQUENCE NETWORK AND ATTENTION 原文: https://pytorch.org/tutorials/intermediate/seq2seq_translation_tut 阅读全文
posted @ 2020-04-18 17:54 TABball 阅读(691) 评论(0) 推荐(0) 编辑
摘要: 初识AlphaZero AlphaZero能够基于强化学习实现较高技巧的棋类博弈,我看过nb网友实现的基于MCTS的五子棋模型后,惊叹不已!特此记录一下其中训练的一些方法和技巧。 MCTS MCTS是指蒙特卡洛搜索树。 蒙特卡洛搜索树没听过的话,想必你是知道蒙特卡罗模拟的。这个模拟过程就是暴力的按照 阅读全文
posted @ 2020-04-18 17:52 TABball 阅读(1844) 评论(0) 推荐(0) 编辑
摘要: 学校的云服务器是Ubuntu16.04的,这给我在服务器上写pytorch带来很大不便。 有vscode remote,怎么能不为我的服务器配好武器呢。 环境 Ubuntu16安装pyenv,加Python3.7 sudo apt-get update -y sudo apt-get install 阅读全文
posted @ 2020-04-18 17:46 TABball 阅读(108) 评论(0) 推荐(0) 编辑
摘要: Matplotlib.pyplot总结 经常看到这样一行代码 这个 ,其实大有来头,它集成了画图的很多方便函数,使用起来也能够结合 ,`list`等工具。 基本用法 我们可以从一张画布开始。 是画板, 是画布,如果 有参数控制多个画布, 可以迭代。 饼图 colorbar 等高线 间断直方图 作图规 阅读全文
posted @ 2020-04-18 17:42 TABball 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 朋友和我说了一道美团面试题。让我对自己的智商产生了一些信心。 ~~这是一篇不成熟的文章,请告诉我怎么减少摘要的最少字数。~~ 题意 告诉你$n,l,r,k$,计算有多少个长度为$n$的数列,满足$l \leq a\_i \leq r,i \in [1,n]$,且$k | \sum_i a_i$。结果 阅读全文
posted @ 2020-04-18 17:35 TABball 阅读(69) 评论(0) 推荐(0) 编辑
摘要: 最近在做一个模型,通过输入的病人身体各项数据判断能否对治疗药物产生应答。基本上来说就是一个普通的分类模型,逻辑回归。 但是我遇到了一个问题,就是训练数据中有大量缺失,后来我向熟人了解到,这是在所难免的,有些患者转院过来,在不同地方就诊,已经提供的身体指标就这些,医院方面也已经确诊了患者,不好再让患者 阅读全文
posted @ 2020-04-18 17:33 TABball 阅读(711) 评论(0) 推荐(0) 编辑
摘要: NLP FROM SCRATCH: CLASSIFYING NAMES WITH A CHARACTER LEVEL RNN "原文" 来自于pytorch官网教程。 文章实现了一个字母级别的基础RNN模型来分类单词。其中并没有用已经提炼过的pytorch中的RNN方法,以展示RNN模型是怎样工作的 阅读全文
posted @ 2020-04-18 17:32 TABball 阅读(343) 评论(0) 推荐(0) 编辑
摘要: libtorch pytorch是一个强大的机器学习库,其中集成了很多方法,但从python本身角度讲,它的速度还不够快。用pytorch官网的话说: 虽然对于许多需要动态性和易迭代性的场景来说,Python是一种合适且首选的语言,但在同样的情况下,Python的这些特性恰恰是不利的。它常常应用于生 阅读全文
posted @ 2020-04-18 17:27 TABball 阅读(4491) 评论(0) 推荐(0) 编辑
摘要: 这个寒假没事学学前端有关知识,之前在学爬虫的时候是对html的初次认识,后来又去写抢课脚本,大概知道了其实浏览器后面很多页面在通信、传数据这么一回事。最近又想看看了。然后又系统的瞧了瞧html\css\javascript的基本概念,详细的属性在后面作为应用手册去看就可以了。 无意间发现一个 "“别 阅读全文
posted @ 2020-04-18 17:25 TABball 阅读(95) 评论(0) 推荐(0) 编辑
摘要: DIP Using Flask 目的 制作一个简单的图像处理软件,能够实现基本的图像处理操作。 DIP 真正核心的图像处理部分是调库的,python在这方面充分展现了第三方库的强大功能。 requirements 如下 GUI 在这个项目中,我的主要工作就是GUI,所以可谈的就比较多了。作为我的第一 阅读全文
posted @ 2020-04-18 17:23 TABball 阅读(140) 评论(0) 推荐(0) 编辑
摘要: JQuery语法 常用 或 上面两者都是在文档加载完毕后调用的。 可以防止类似下面的错误 试图隐藏一个不存在的元素 获得未完全加载的图像的大小。 选择器 选择标签: 选择id: 选择类 除此之外,还有: 选择子标签 选择满足条件的标签 选取当前标签 JQuery事件 | 鼠标事件 | 键盘事件 | 阅读全文
posted @ 2020-04-18 15:19 TABball 阅读(66) 评论(0) 推荐(0) 编辑