摘要: 1 自然语言的特点 线性:⾃然语⾔呈现为⼀种线性的符号序列。 层次性:⾃然语⾔内部存在层次结构。 歧义性:同⼀个⾃然语⾔句⼦存在多种不同的理解。 演化性:⾃然语⾔随着时代不断演化。 2 自然语言的典型任务 2.1 中文分词 输入:⼀段不带空格的汉语⽂本。 输出:以空格隔开词语的汉语⽂本。 高效的中文 阅读全文
posted @ 2023-02-20 14:15 Laplace蒜子 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 1 线性回归简介 1.1 回归与分类的区别 若预测的值是离散值,如年龄,此类任务位“分类”。 若预测的值是连续值,如房价,此类任务为“回归”。 1.2 回归的目标 学习一个从输入X到输出Y的映射f,并根据该模型,对新的测试数据x进行预测,简单来说,就是找到一个输入与输出之间的映射,用于与新的输入。 阅读全文
posted @ 2023-02-18 22:18 Laplace蒜子 阅读(347) 评论(0) 推荐(0) 编辑
摘要: 1 相关概念 1.1 半监督学习的定义 同时利用有标注数据和无标注数据学习 1.2 半监督分类/回归 给定标注数据和无标注数据,学习得到一个分类器f,要求该分类器f比只用标注数据学习得到的学习器更优。 1.3 半监督聚类/降维 给定标注数据,但是另外对数据做一些限制 聚类:两个点必须在一个簇,或两个 阅读全文
posted @ 2023-02-17 17:39 Laplace蒜子 阅读(608) 评论(0) 推荐(0) 编辑
摘要: 集成学习 产生原因 已经开发了很多机器学习算法,单个模型的性能已经调到了最优,很难在改进。 基本框架 将多个弱学习器进行融合,通过样本加权,学习器加权,获得比单一学习器性能更加优越的强学习器。 Bagging(Bootstrap aggregating) Bootstrap采样 给定包含N个样本的数 阅读全文
posted @ 2023-02-08 21:09 Laplace蒜子 阅读(42) 评论(0) 推荐(0) 编辑
摘要: 聚类的定义 聚类是一种非监督学习任务,其目的是发现数据中隐含的结构。 相似度度量 样本之间的相似性对聚类的结果很关键,在聚类的时候,是根据相似度来聚类的。 定义距离参数 非负性:两个样本之间的距离只能大于等于0; 可辨识性:样本只与自己的距离为0,与其他样本不会重叠; 对称性:样本a到样本b的距离等 阅读全文
posted @ 2023-02-06 11:05 Laplace蒜子 阅读(516) 评论(0) 推荐(0) 编辑
摘要: 降维的定义 降维是将高维数据变成低维表示,同时数据中蕴含的信息尽量保持不变。(高维 —> 低维) 降维是一种非监督学习任务。因为降维过程中不用样本的标签。(非监督) 降维的必要性 有时候虽然原始输入是高维数据,但这些输入特征之间有冗余。其本质维度可能很低。 降维方式 PCA降维 基本思路 对原数据样 阅读全文
posted @ 2023-02-02 22:23 Laplace蒜子 阅读(251) 评论(0) 推荐(0) 编辑
摘要: 计算与传输重叠 工作模式 CPU与GPU之间交互有两个引擎: 内存复制引擎:负责CPU和GPU之间的数据传输。 核函数执行引擎:负责CPU向GPU部署核函数任务。 这两个引擎是相互独立的,可以并发执行。 查看是否支持 cudaGetDeviceProperties()函数,通过deviceOverl 阅读全文
posted @ 2023-02-01 21:43 Laplace蒜子 阅读(362) 评论(0) 推荐(0) 编辑
摘要: 错误处理 接收错误信息 定义一个cudaError_t类型的变量来接收错误信息 cudaError_t err; 获取错误信息的字符串 cudaGetErrorString(err); 使用方法: cout<<cudaGetErrorString(err)<<endl; 获取核函数执行后最后一次错误 阅读全文
posted @ 2023-01-31 22:18 Laplace蒜子 阅读(225) 评论(0) 推荐(0) 编辑
摘要: nsys分析应用程序 命令行 nsys profile --stats=true ./CUDA程序 说明:生成的报告文件不会覆盖原来的报告文件,生成名称为report1,report2... 内容 CUDA API统计信息 CUDA核函数的统计信息 CUDA内存操作统计信息(时间和大小) 阅读全文
posted @ 2023-01-31 20:11 Laplace蒜子 阅读(212) 评论(0) 推荐(0) 编辑
摘要: 内存 1 内存读写速度 线程寄存器读写:1个时钟周期延迟 线程本地内存读写:非常慢 块的共享内存读写:1个时钟周期延迟,但是可能冲突 网格全局内存读写:500个时钟周期延迟,联合访问时会有隐含延迟。 网格的常量内存和纹理内存读取:500个时钟周期延迟。但是有缓存 2 内存模型 2.1 寄存器 修饰符 阅读全文
posted @ 2023-01-30 17:35 Laplace蒜子 阅读(1518) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示