摘要:
【我们是谁】 国际站是阿里巴巴近年来发展最迅速的部门之一。在疫情期间,我们的线上展会、在线交易都迎来了爆发式的增长,国际站成为越来越多中小商家的外贸首选。而我们是国际站基础育商团队,一支致力于培育全球优秀商家的顶级业务团队,业务涵盖旺铺装修、商品管理、互动沟通、店铺数据分析等等多个业务。 【岗位优势 阅读全文
摘要:
特征演化的数据流 数据流学习是近年来机器学习与数据挖掘领域的一个热门的研究方向,数据流的场景和静态数据集的场景最大的一个特点就是数据会发生演化,关于演化数据流的研究大多集中于概念漂移检测(有监督学习),概念/聚类演化分析(无监督学习),然而,人们往往忽略了一个经常出现的演化场景:特征演化。大多数研究 阅读全文
摘要:
Clustering 聚类 密度聚类——DBSCAN 前面我们已经介绍了两种聚类算法:k-means和谱聚类。今天,我们来介绍一种基于密度的聚类算法——DBSCAN,它是最经典的密度聚类算法,是很多算法的基础,拥有很多聚类算法不具有的优势。今天,小编就带你理解密度聚类算法DBSCAN的实质。 DBS 阅读全文
摘要:
Clustering 聚类 谱聚类 上文我们引入了是聚类,并介绍了第一种聚类算法K-means。今天,我们来介绍一种流行的聚类算法——谱聚类(Spectral Clustering),它的实现简单,而且效果往往好于传统的聚类算法,如k-means,但是其背后的原理涉及了很多重要而复杂的知识,如图论, 阅读全文
摘要:
Clustering 聚类K-means 聚类是机器学习和数据挖掘领域的主要研究方向之一,它是一种无监督学习算法,小编研究生时期的主要研究方向是“数据流自适应聚类算法”,所以对聚类算法有比较深刻的理解,于是决定开一个专题来写聚类算法,希望可以为入门及研究聚类相关算法的读者带来帮助。聚类可以作为一个单 阅读全文
摘要:
半监督支持向量机(S3VMs) 今天我们主要介绍SVM分类器以及它的半监督形式S3VM,到这里我们关于半监督学习基础算法的介绍暂时告一段落了。之后小编还会以论文分享的形式介绍一些比较新的半监督学习算法。让我们开始今天的学习吧~ 引入 支持向量机(SVM)相信大家并不陌生吧?但是如果数据集中有大量无标 阅读全文
摘要:
基于图的半监督学习 以一个无标签数据的例子作为垫脚石 Alice正在翻阅一本《Sky and Earth》的杂志,里面是关于天文学和旅行的文章。Alice不会英文,她只能通过文章中的图片来猜测文章的类别。比如第一个故事是“Bridge Asteroid”有一张多坑的小行星图片,那么它很明显是天文学类 阅读全文
摘要:
Semi-Supervised Learning 半监督学习(三) 方法介绍 Mixture Models & EM 无标签数据告诉我们所有类的实例混和在一起是如何分布的,如果我们知道每个类中的样本是如何分布的,我们就能把混合模型分解成独立的类,这就是mixture models背后的机制。今天,小 阅读全文
摘要:
循环神经网络导读 循环神经网络(Recurrent Neural Network)是一类以序列数据为输入,在序列的演进方向进行递归且所有节点(循环单元)按链式连接的递归神经网络。其中双向循环神经网络(Bidirectional RNN, Bi-RNN)和长短期记忆网络(Long Short-Term 阅读全文
摘要:
Semi-Supervised Learning 半监督学习(二) 介绍 在上篇文章中我们介绍了关于统计机器学习和半监督学习的一些基本概念。在这篇文章中,我们仍着重带读者更深入地了解半监督学习基础,了解半监督学习的常用方法,模型假设,并且通过实例带读者去理解半监督学习的过程。难度依然较基础,但是相信 阅读全文
摘要:
Semi-Supervised Learning 半监督学习(一) 入门级介绍 传统的机器学习任务分为无监督学习(数据无标签,如,聚类,异常检测等)和监督学习(数据有标签,如,分类,回归等)。半监督学习针对的是只有部分数据有标签的学习任务,而其中有标签数据往往远远小于无标签数据。它是机器学习领域研究 阅读全文
摘要:
在使用Word编写文章时,总会遇到书写数学公式的情况。使用Word的公式输入工具需要频繁地使用鼠标,因而编写公式会显得繁琐麻烦,那么有什么办法可以优雅地在Word中书写公式呢?其实Word早在Word 2007中就提供了像Latex一样使用代码书写公式的特性。详情可见Linear format eq 阅读全文
摘要:
排序算法进阶 上篇文章中我们主要介绍了经典的八大排序算法,从算法思想,动图演示,代码实现,复杂度及稳定性分析等角度进行学习。还没阅读的童鞋可以点这里进行浏览。 求知若渴的你肯定不会满足于入门的内容,今天,小编在上一篇的基础上,对多种排序算法进行优化,让我们一起来康康吧~~ 01冒泡排序 1. 优化一 阅读全文
摘要:
排序算法入门 在我们初学算法的时候,最先接触到的就是排序算法,这些排序算法应用十分广泛,而且是很多算法的基础,可以说是每个程序员都必须得掌握的了。今天小编就来带你一举拿下经典的八大排序算法,每种算法都会有算法思想描述,动图演示,代码实现,复杂度及稳定性分析等。 01冒泡排序 1. 原理 假如我们要将 阅读全文
摘要:
剑指offer题解(Java版) 从尾到头打印链表 题目描述 输入一个链表,按从尾到头的顺序返回一个ArrayList。 方法1:用一个栈保存从头到尾访问链表的每个结点的值,然后按出栈顺序将各个值存入ArrayList中; 方法2:逆序打印1 2 3,可以先逆序打印2 3,最后再打印第一个结点1。 阅读全文
摘要:
一. 先聊点别的 1. sql & nosql sql指关系型数据库,如Oracle,MySQL等,nosql泛指非关系型数据库,如MongoDB,Redis等;SQL数据存在特定结构的表中,而NoSQL则更加灵活和可扩展,存储方式可以是JSON文档,哈希表或其他方式;在sql中必须定义好表和字段结 阅读全文
摘要:
《高性能MySQL》读书笔记 一. 索引的优点 1. 索引可以让服务器快速定位到表的指定位置,大大减少了服务器需要扫描的数量; 2. 最常见的B-Tree索引按照顺序存储数据,可以用来做order by和group by操作帮助服务器避免排序和临时表; 3. 可以将随机I/O变为顺序I/O; 二. 阅读全文
摘要:
1. minimum-depth-of-binary-tree 题目描述 Given a binary tree, find its minimum depth.The minimum depth is the number of nodes along the shortest path from 阅读全文
摘要:
1. 单例模式(在内存之中永远只有一个对象) 1.1 多线程安全单例模式——不使用同步锁 上述代码中的一个缺点是该类加载的时候就会直接new 一个静态对象出来,当系统中这样的类较多时,会使得启动速度变慢 。现在流行的设计都是讲“延迟加载”,我们可以在第一次使用的时候才初始化第一个该类对象。所以这种适 阅读全文
摘要:
本篇文章主要是总结Java多线程/高并发编程的知识点,由浅入深,仅作自己的学习笔记,部分侵删。 一 . 基础知识点 1. 进程于线程的概念 2.线程创建的两种方式 注:public void run()方法提供了线程实际工作的代码; 继承Thread类的方法存在单继承的缺陷; Runnable的代码 阅读全文
摘要:
好文!http://blog.csdn.net/v_july_v/article/details/7624837 阅读全文
摘要:
注:此博文只是自己总结的笔记,参考很很多大牛的博客。 决策树算法之ID3算法 1.奥卡姆剃刀: 若有多个假设和观察值一致,则选择简单的那个。(be simple) 2.算法核心思想: 期望信息越小,信息增益越大,从而纯度越高。ID3算法以信息增益为度量选择,选择分裂后信息增益最大的属性进行分裂。所以 阅读全文
摘要:
梯度下降法 下面的h(x)是要拟合的函数,J(θ)损失函数,theta是参数,要迭代求解的值,theta求解出来了那最终要拟合的函数h(θ)就出来了。其中m是训练集的记录条数,j是参数的个数。 梯度下降法流程: (1)先对θ随机赋值,可以是一个全零的向量。 (2)改变θ的值,使J(θ)按梯度下降 阅读全文
摘要:
第一章.方法概论 <! more 1.监督学习:对任意给定输入,对其相应的输出做一个好的预测。 2.回归问题:输入变量与输出变量都为连续变量的预测问题。 分类问题:输入变量为有限个离散变量的预测问题。 标注问题:输入输出变量均为变量序列的预测问题。 3.概率模型: 由条件概率分布P(Y|X) 阅读全文
摘要:
HiBench资源及教程:https://github.com/intel-hadoop/HiBench 介绍: Hadoop新人 环境 linux 该笔记针对英语弱鸡&自己在使用过程用遇到的问题的记录。 步骤: 首先创建一个文件夹HiBench:mkdir HiBench cd HiBench g 阅读全文