随笔分类 -  BigDataAIML / NLP

Natural Language Processing
摘要:SciTech-EECS-BigDataAIML: SVD(奇异值分解) Singular Value(奇异值) 就是 Eigenvalue 的平方根. SVD 线性代数皇冠👑上的明珠 熟知SVD, 可以使我们更深刻地理解"Matrix(矩阵)"的"代数结构"和"几何意义". SVD(奇异值分解) 阅读全文
posted @ 2025-02-07 21:41 abaelhe 阅读(16) 评论(0) 推荐(0) 编辑
摘要:Measurement 测度 Euclidian Distance(欧几理得距离) \(\large \begin{array}{rl} \ EuDistance(Point_1, Point_2) &= \sqrt{(x_1 - x_2)^2 + (y_1 - y_2)^2} \ where: 阅读全文
posted @ 2024-10-26 07:17 abaelhe 阅读(54) 评论(0) 推荐(0) 编辑
摘要:SciTech-BigDataAIML- Boltzmann constant 阅读全文
posted @ 2024-10-25 00:59 abaelhe 阅读(16) 评论(0) 推荐(0) 编辑
摘要:SciTech-BigDataAIML-LLM PE(Positional Encoding)位置编码: BOW(Bag of Words)词袋模型:丢弃Word位置信息, 只统计Word之间的 Co-occurrence Probability(共现概率)。 RNN(Recurrent neura 阅读全文
posted @ 2024-08-22 23:41 abaelhe 阅读(25) 评论(0) 推荐(0) 编辑
摘要:词汇 MI(Mobile Internet): 移动互联网 IoT(Internet of Things): 万物互联网 Supervised Statistical Model: \(\large Supervised\ Learn 阅读全文
posted @ 2024-08-15 15:32 abaelhe 阅读(4) 评论(0) 推荐(0) 编辑
摘要:SciTech-BigDataAIML-LLM-Transformer Series系列: Word Embedding词嵌入详解: 1. 用Corpus预训练出嵌入矩阵E Corpus Collecting: 非常重要的工作 先收集一个常用的\(\lar 阅读全文
posted @ 2024-08-13 22:51 abaelhe 阅读(63) 评论(0) 推荐(0) 编辑
摘要:https://www.geeksforgeeks.org/how-to-remove-the-background-from-an-image-using-python/ Remove Background Image # Install required packages first. # pi 阅读全文
posted @ 2024-08-05 19:12 abaelhe 阅读(12) 评论(0) 推荐(0) 编辑
摘要:Links: https://pyimagesearch.com/2021/01/23/splitting-and-merging-channels-with-opencv/ OpenCV Official: https://docs.opencv.org/3.4/d3/df2/tutorial_p 阅读全文
posted @ 2024-08-05 13:43 abaelhe 阅读(21) 评论(0) 推荐(0) 编辑
摘要:Descriptive Stats + percentiles in numpy and scipy.stats https://dev.to/sayemmh/descriptive-stats-percentiles-in-numpy-and-scipystats-59a7 Abbreviatio 阅读全文
posted @ 2024-07-19 21:04 abaelhe 阅读(27) 评论(0) 推荐(0) 编辑
摘要:世界发达国家招聘站Monster.com / Indeed.com 以NLP/AI/ML统计, 分析是非常好的数据源. 1. https://www.monster.com 2. Indeed.com: Github: https://github.com/hiring-lab/job_postin 阅读全文
posted @ 2023-08-22 21:35 abaelhe 阅读(32) 评论(0) 推荐(0) 编辑
摘要:0. 安装Rust(Python库safetensors依赖Rust)并启用本地仓库crates加速下载: `rm -rf ~/.cargo ` #删除所有Rust残余旧版本 ` pkg install rust ` #最好安装完退出Termux所有Sessions `$ mkdir -p ~ 阅读全文
posted @ 2023-06-20 13:27 abaelhe 阅读(645) 评论(0) 推荐(0) 编辑
摘要:Corpus语料库与DB数据库 World Knowledge世界常识库:OALD牛津高阶/Synonyms/Phrases/…, 新华字典/成语词典/辞海, 行业词典,大英百科,Wikipedia,… 全局信息: Corpus语料库、行业通用数据库(例如Springer/Google Schola 阅读全文
posted @ 2023-06-11 09:04 abaelhe 阅读(96) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示