随笔分类 -  BigDataAIML / NLP

Natural Language Processing
摘要:SciTech-EECS-BigDataAIML: SVD(奇异值分解) Singular Value(奇异值) 就是 Eigenvalue 的平方根. SVD的 优势 和 分量的作用 SVD 具有多种优势,例如: 优势 说明 数值稳定性 SVD 具有数值稳定性,可以处理病态矩阵。 最佳低秩近似 S 阅读全文
posted @ 2025-02-07 21:41 abaelhe
摘要:Measurement 测度 Euclidian Distance(欧几理得距离) \(\large \begin{array}{rl} \\ EuDistance(Point_1, Point_2) &= \sqrt{(x_1 - x_2)^2 + (y_1 - y_2)^2} \\ where: 阅读全文
posted @ 2024-10-26 07:17 abaelhe 阅读(259) 评论(0) 推荐(0)
摘要:SciTech-BigDataAIML- Boltzmann constant 阅读全文
posted @ 2024-10-25 00:59 abaelhe 阅读(61) 评论(0) 推荐(0)
摘要:SciTech-BigDataAIML-LLM PE(Positional Encoding)位置编码: BOW(Bag of Words)词袋模型:丢弃Word位置信息, 只统计Word之间的 Co-occurrence Probability(共现概率)。 RNN(Recurrent neura 阅读全文
posted @ 2024-08-22 23:41 abaelhe 阅读(74) 评论(0) 推荐(0)
摘要:词汇 $\large MI $(Mobile Internet): 移动互联网 $\large IoT $(Internet of Things): 万物互联网 \(\large Supervised\ Statistical\ Model\): \(\large Supervised\ Learn 阅读全文
posted @ 2024-08-15 15:32 abaelhe 阅读(64) 评论(0) 推荐(0)
摘要:SciTech-BigDataAIML-LLM-Transformer Series系列: Word Embedding词嵌入详解: 1. 用Corpus预训练出嵌入矩阵\(\large E\) \(\large Corpus\) Collecting: 非常重要的工作 先收集一个常用的\(\lar 阅读全文
posted @ 2024-08-13 22:51 abaelhe 阅读(123) 评论(0) 推荐(0)
摘要:https://www.geeksforgeeks.org/how-to-remove-the-background-from-an-image-using-python/ Remove Background Image # Install required packages first. # pi 阅读全文
posted @ 2024-08-05 19:12 abaelhe 阅读(90) 评论(0) 推荐(0)
摘要:Links: https://pyimagesearch.com/2021/01/23/splitting-and-merging-channels-with-opencv/ OpenCV Official: https://docs.opencv.org/3.4/d3/df2/tutorial_p 阅读全文
posted @ 2024-08-05 13:43 abaelhe 阅读(82) 评论(0) 推荐(0)
摘要:Descriptive Stats + percentiles in numpy and scipy.stats https://dev.to/sayemmh/descriptive-stats-percentiles-in-numpy-and-scipystats-59a7 Abbreviatio 阅读全文
posted @ 2024-07-19 21:04 abaelhe 阅读(191) 评论(0) 推荐(0)
摘要:世界发达国家招聘站Monster.com / Indeed.com 以NLP/AI/ML统计, 分析是非常好的数据源. 1. https://www.monster.com 2. Indeed.com: Github: https://github.com/hiring-lab/job_postin 阅读全文
posted @ 2023-08-22 21:35 abaelhe 阅读(85) 评论(0) 推荐(0)
摘要:0. 安装Rust(Python库safetensors依赖Rust)并启用本地仓库crates加速下载: `$ rm -rf ~/.cargo ` #删除所有Rust残余旧版本 `$ pkg install rust ` #最好安装完退出Termux所有Sessions `$ mkdir -p ~ 阅读全文
posted @ 2023-06-20 13:27 abaelhe 阅读(1010) 评论(0) 推荐(0)
摘要:Corpus语料库与DB数据库 World Knowledge世界常识库:OALD牛津高阶/Synonyms/Phrases/…, 新华字典/成语词典/辞海, 行业词典,大英百科,Wikipedia,… 全局信息: Corpus语料库、行业通用数据库(例如Springer/Google Schola 阅读全文
posted @ 2023-06-11 09:04 abaelhe 阅读(126) 评论(0) 推荐(0)