随笔 - 934, 文章 - 0, 评论 - 249, 阅读 - 345万

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

随笔分类 -  机器学习

摘要:文本是时序型数据,词与词之间的顺序关系往往影响整个句子的含义。这里我整理了一些顺序不同,含义不同的例子。 传统的RNN模型在处理句子时,以序列的模式逐个处理句子中的词语,这使得词语的顺序信息在处理过程中被天然的保存下来了,并不需要额外的处理。 而对于Transformer来说,由于句子中的词语都是同 阅读全文

posted @ 2023-02-20 19:41 蝈蝈俊 阅读(3489) 评论(0) 推荐(0) 编辑

摘要:对智能感知的定义:更聪明的感知,通过引入新技术、人工智能,做到:感知范围全面,感知波动精细,知道影响根因,能抽象出实际业务架构图...。 智能感知关键工作: 感知影响范围; 感知波动变化(不仅仅是超阈值的报警,用于故障边缘的压测和演练,日常的运营); 感知影响根因(大家都有波动、报警时,是谁引起的, 阅读全文

posted @ 2022-12-08 16:40 蝈蝈俊 阅读(66) 评论(0) 推荐(0) 编辑

摘要:早在文艺复兴时期,培根就提出了“知识就是力量”,在当今人工智能时代,各大科技公司更是纷纷提出:知识图谱就是人工智能的基础。 一、什么是知识图谱? 知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现更智能的搜索引擎,并且于2013年以后开始在学术界和业界普及。 知识图 阅读全文

posted @ 2022-12-01 19:38 蝈蝈俊 阅读(393) 评论(0) 推荐(0) 编辑

摘要:package ml import ( "github.com/dmitryikh/leaves" ) var modelML *leaves.Ensemble // 初始化加载模型 func initML() { if modelML != nil { return } useTransforma 阅读全文

posted @ 2022-11-07 14:50 蝈蝈俊 阅读(325) 评论(3) 推荐(0) 编辑

摘要:向量是由n个实数组成的一个n行1列(n1)或一个1行n列(1n)的有序数组; 向量的点乘,也叫向量的内积、数量积,对两个向量执行点乘运算,就是对这两个向量对应位一一相乘之后求和的操作,点乘的结果是一个标量。 代数定义 于向量a和向量b: a和b的点积公式为: 前提条件:要求一维向量a和向量b的行列数 阅读全文

posted @ 2022-04-29 19:55 蝈蝈俊 阅读(1448) 评论(0) 推荐(1) 编辑

摘要:在机器学习算法中,常会遇到分类特征是离散的,无序的。 例如:性别有男、女,城市有北京,上海,深圳等。 性别特征:["男","女"] => 0,1 地区特征:["北京","上海,"深圳"] => 0,1,2 工作特征:["演员","厨师","公务员","工程师","律师"] => 0,1,2,3,4 阅读全文

posted @ 2022-04-10 21:20 蝈蝈俊 阅读(145) 评论(0) 推荐(0) 编辑

摘要:数据来源 这里使用的数据数据是使用 Nebula Console 创建的测试数据 https://docs.nebula-graph.com.cn/2.6.1/2.quick-start/3.connect-to-nebula-graph/#_3 数据结构 常用查询语句 GO 语句 GO 语句可以根 阅读全文

posted @ 2021-12-10 19:43 蝈蝈俊 阅读(935) 评论(0) 推荐(0) 编辑

摘要:安装centos7 在 https://hub.docker.com/_/centos?tab=tags 选择你需要安装的centos版本,我选择的是 7.9.2009 版本。 启动、配置 centos7.9.2009镜像 注意: Centos 7 使用命令 ip addr 查看IP地址。 保存镜像 阅读全文

posted @ 2021-12-10 14:49 蝈蝈俊 阅读(884) 评论(0) 推荐(0) 编辑

摘要:ROC曲线 ROC曲线的全称是“接收者操作特征曲线”(receiver operating characteristic curve),它是一种坐标图式的分析工具,用于: ROC曲线渊源 ROC曲线起源于第二次世界大战时期雷达兵对雷达的信号判断。当时每一个雷达兵的任务就是去解析雷达的信号,但是当时的 阅读全文

posted @ 2021-11-26 19:23 蝈蝈俊 阅读(1105) 评论(0) 推荐(0) 编辑

摘要:安装 pip install lightgbm conda install lightgbm 【python】conda和pip安装库之间的区别 代码 from lightgbm import LGBMClassifier X = [[1,2],[3,4],[5,6],[7,8],[9,10]] y 阅读全文

posted @ 2021-09-13 07:46 蝈蝈俊 阅读(660) 评论(1) 推荐(0) 编辑

摘要:数据文件说明 本示例的数据集文件可以在https://github.com/dmlc/xgboost/tree/master/demo/data这里获得。 该数据集描述的是不同蘑菇的相关特征,如大小、颜色等,并且每一种蘑菇都会被标记为可食用的(标记为0)或有毒的(标记为1)。 LibSVM 格式说明 阅读全文

posted @ 2021-07-27 19:50 蝈蝈俊 阅读(1129) 评论(0) 推荐(0) 编辑

摘要:XGBoost本质上就是一种GBDT,但是力争把速度和效率提高到极致,所以叫X (Extreme) GBoosted。 下面例子来自:陈天奇的讲义PPT 我们要预测一家人对电子游戏的喜好程度。 Tree1: 考虑到年轻和年老相比,年轻更可能喜欢电子游戏,以及男性和女性相比,男性更喜欢电子游戏,故先根 阅读全文

posted @ 2021-07-25 20:08 蝈蝈俊 阅读(195) 评论(0) 推荐(0) 编辑

摘要:余弦相似度计算公式看:余弦相似度Cosine Similarity相关计算公式。 余弦相似度在度量各种相似度上比较常用。 案例:文本相似度 比如有下面两个句子,我们要计算这两个句子的相似度。 句子A:他不仅是一个歌手,还是一个舞者; 句子B:他既是一个歌手,也是一个舞者。 我们从词频入手,来计算其相 阅读全文

posted @ 2021-07-23 10:53 蝈蝈俊 阅读(511) 评论(0) 推荐(0) 编辑

摘要:余弦相似度,又称为余弦相似性,是通过测量两个向量的夹角的余弦值来度量它们之间的相似性。 两个方向完全相同的向量的余弦相似度为1,而两个彼此相对的向量的相似度为-1。 注意,它们的大小并不重要,因为这是方向的度量。 如何计算 余弦定理 余弦定理是三角形中三边长度与一个角的余弦值(cos)的数学式。 余 阅读全文

posted @ 2021-07-23 07:55 蝈蝈俊 阅读(21092) 评论(0) 推荐(3) 编辑

摘要:机器学习过程主要包括:数据的特征提取、数据预处理、训练模型、测试模型、模型评估改进等几部分: 机器学习算法主要包括以下几类: regression (回归) 回归:建立一个回归方程来预测目标值,用于连续型分布预测。 回归算法在很多领域得到了普遍应用,在金融方面,可以用它来做股市行情分析和预测;在产品 阅读全文

posted @ 2021-07-19 10:24 蝈蝈俊 阅读(427) 评论(0) 推荐(0) 编辑

摘要:回归分析(Regression Analysis)是一种统计学上分析数据的方法,目的在于了解两个或多个变数间是否相关、相关方向与强度,并建立数学模型以便观察特定变数来预测研究者感兴趣的变数。 一元线性回归分析 在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析 阅读全文

posted @ 2017-01-16 17:45 蝈蝈俊 阅读(5029) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示