戴墨镜的长颈鹿

2022年5月3日

摘要： Hugging Face 基本函数 tokenizer.tokenize(text)：返回一个list，分词，将序列拆分为tokenizer词汇表中可用的tokens，这个中文是拆分为了单个的字，英文是subword tokenizer(text1,text2,..) 等效于 tokenizer.e 阅读全文

posted @ 2022-05-03 11:03 戴墨镜的长颈鹿阅读(3176) 评论(0) 推荐(0) 编辑

2022年1月26日

focal loss

摘要：动机： 1⃣️ 正负样本的比例可能十分不均衡，1:1000，且大部分负样本都是easy example 2⃣️ 虽然easy 样本（正类的分数接近1，负类分数接近0的那些）本身的loss就很低，但由于数量众多，依旧对loss有很大的贡献。目标：用一个合适的函数去度量难分类样本和易分类样本对总损失的阅读全文

posted @ 2022-01-26 15:46 戴墨镜的长颈鹿阅读(330) 评论(0) 推荐(0) 编辑

2021年3月10日

数据结构知识点速览

摘要：清华大学-邓俊辉MOOC数据结构与算法部分笔记阅读全文

posted @ 2021-03-10 19:32 戴墨镜的长颈鹿阅读(290) 评论(0) 推荐(0) 编辑

2021年2月22日

Notes on Weight Initialization for Deep Neural Networks

摘要：神经网络通常会包含很多次连续的 matrix 和 vector 之间的乘法，即 $a * x$ 。很多次连续的乘法后，会导致结果向量的值要么很大，要么被减小为0。我们可以通过除以了数值 $a$ （也称 scaling_factor，缩放因子）来将结果向量的值缩放到一个正常的范围阅读全文

posted @ 2021-02-22 13:58 戴墨镜的长颈鹿阅读(84) 评论(0) 推荐(0) 编辑

2021年1月31日

keras 使用经验

摘要： keras arc 阅读全文