随笔分类 - 机器学习
摘要:强化学习 Reinforcement Learning 强化学习是一种机器学习思想,其关心一个智能体如何采取行动以达到最大化激励回报。 基本的强化学习模型以马尔可夫决策过程建模。 马尔可夫决策过程 Markov Decision Process 系统要素 A 行动空间; S状态空间; $P^a_{s
阅读全文
摘要:机器学习技术间的包含关系: 深度学习⊆表示学习(即特征学习)⊆机器学习⊆人工智能 相比于(传统)机器学习,可以认为深度学习自动学习到特征,而(传统)机器学习中特征则由人工进行设计和提取。 multi-class (多分类中的)多类别任务。一个样本的类别有且仅有多个类别中的一个。 multi-labe
阅读全文
摘要:Graph Representation Learning (Graph Neural Networks, GNN) A Review of methods and applications, Zhou Jie 2020, on AI Open Figure. An overwiew of comp
阅读全文
摘要:机器学习 (传统机器学习) (Machine Learning) 预测的是离散值,则学习任务称为“分类”(classification)任务;预测的是连续值,则是“回归”(regression)任务。 对于二分类任务,一类通常称为“正类”(正例,positive class/label),另一类称为
阅读全文
摘要:Sampling 采样 A* sampling CJ Maddison, 2014, NeurIPS A pratical generic sampling algorithm that searchs for the maximum of a Gumbel process using A* sea
阅读全文
摘要:Finite State Automaton also called Finite State Machine, State Machine, 是一种计算数学模型,其根据输入时序信号将抽象机器从一种状态改变到另一种状态。 Deterministic Finite Automaton, DFA (au
阅读全文
摘要:降维 Dimensionality Reduction 主成分分析 Principle Components Analysis, PCA 要对数据进行零均值化预处理。 对协方差矩阵进行奇异值分解,或者进行特征分解。 零均值化的数据矩阵 : $
阅读全文
摘要:numpy 创建ndarray np.array(some_np_array) clone a nd-array (e.g. a vector, a matrix). np.array(list) 一阶 如果是类似一维数组,则返回向量(1D-array,不存在行、列之分,shape都是(n,)而非(
阅读全文
摘要:GenSim——NLP工具 GenSim is an open source python library for nlp modelling. API online docs (from official site:) GenSim: topic modelling for humans. Tra
阅读全文
摘要:短文本、字符串的相似度计算方法一般是非深层语义的,速度比较快。 string-based, corpus-based, knowledge-based (e.g. wordnet). 常见算法有: LCS, Longest common substring Jaro-Distance, based
阅读全文
摘要:Word Mover's Distance Family 文本相似度评估方法 Word Mover's Distance Family (until 2020): WCD, word centroid distance WMD, word mover's distance S-WCD, superv
阅读全文
摘要:matplotlib —— 数据图绘制工具 matplotlib 是绘制统计图的python工具。 示例绘图 https://matplotlib.org/tutorials/introductory/sample_plots.html 设置 Settings # 文字不清晰?清晰度、分辨率不够?用
阅读全文
摘要:Hidden Markov Model (HMM) 隐马尔可夫模型 离散马尔可夫过程:一个系统,其在任意时刻会处于且只能处于N个状态中的一个。记状态集为 ,系统在时刻t时的状态为 ,意味着 \(q_t=S_i\in S, 1\
阅读全文
摘要:TensorFlow ========= "TensorFlow" 是一个机器学习(即亦包括深度学习)的编程框架。 张量 张量是tensorflow计算中数据的基本单位,通过 获取形状, 获取数值类型, 获取数值(将张量以numpy数组形式返回)。 变量的域 两种域(scope),名字域(name_
阅读全文