随笔分类 - BigDataAIML / NLP
Natural Language Processing
摘要:SciTech-EECS-BigDataAIML: SVD(奇异值分解) Singular Value(奇异值) 就是 Eigenvalue 的平方根. SVD 线性代数皇冠👑上的明珠 熟知SVD, 可以使我们更深刻地理解"Matrix(矩阵)"的"代数结构"和"几何意义". SVD(奇异值分解)
阅读全文
摘要:Measurement 测度 Euclidian Distance(欧几理得距离) \(\large \begin{array}{rl} \ EuDistance(Point_1, Point_2) &= \sqrt{(x_1 - x_2)^2 + (y_1 - y_2)^2} \ where:
阅读全文
摘要:SciTech-BigDataAIML- Boltzmann constant
阅读全文
摘要:SciTech-BigDataAIML-LLM PE(Positional Encoding)位置编码: BOW(Bag of Words)词袋模型:丢弃Word位置信息, 只统计Word之间的 Co-occurrence Probability(共现概率)。 RNN(Recurrent neura
阅读全文
摘要:SciTech-BigDataAIML-LLM-Transformer Series系列: Word Embedding词嵌入详解: 1. 用Corpus预训练出嵌入矩阵 Collecting: 非常重要的工作 先收集一个常用的\(\lar
阅读全文
摘要:https://www.geeksforgeeks.org/how-to-remove-the-background-from-an-image-using-python/ Remove Background Image # Install required packages first. # pi
阅读全文
摘要:Links: https://pyimagesearch.com/2021/01/23/splitting-and-merging-channels-with-opencv/ OpenCV Official: https://docs.opencv.org/3.4/d3/df2/tutorial_p
阅读全文
摘要:Descriptive Stats + percentiles in numpy and scipy.stats https://dev.to/sayemmh/descriptive-stats-percentiles-in-numpy-and-scipystats-59a7 Abbreviatio
阅读全文
摘要:世界发达国家招聘站Monster.com / Indeed.com 以NLP/AI/ML统计, 分析是非常好的数据源. 1. https://www.monster.com 2. Indeed.com: Github: https://github.com/hiring-lab/job_postin
阅读全文
摘要:0. 安装Rust(Python库safetensors依赖Rust)并启用本地仓库crates加速下载: ` pkg install rust ` #最好安装完退出Termux所有Sessions `$ mkdir -p ~
阅读全文
摘要:Corpus语料库与DB数据库 World Knowledge世界常识库:OALD牛津高阶/Synonyms/Phrases/…, 新华字典/成语词典/辞海, 行业词典,大英百科,Wikipedia,… 全局信息: Corpus语料库、行业通用数据库(例如Springer/Google Schola
阅读全文