摘要:
摘要:深度学习时期,与CV、语音、NLP领域不同,搜推广场景下特征工程仍然对业务效果具有很大的影响, 阅读全文
摘要:
所谓学习问题,是指观察由n个样本组成的集合,并根据这些数据来预测未知数据的性质。 学习任务(一个二分类问题): 区分一个普通的互联网检索Query是否具有某个垂直领域的意图。假设现在有一个O2O领域的垂直搜索引擎,专门为用户提供团购、优惠券的检索;同时存在一个通用的搜索引擎,比如百度,通用搜索引擎希 阅读全文
摘要:
传统互联网的商业模式,说白了就是通过流量获得收益。这里面有两个问题,一个是怎么获得流量,另外一个是怎么获得收益?先来说说怎么获得流量。互联网企业一般通过提供平台,服务,或内容来吸引用户。这里面有一个基本原则就是,一般提供的基础平台基础服务或基本内容都是免费的。比如门户网站提供信息的整理和分类,搜索引... 阅读全文
摘要:
对GBDT算法原理进行介绍,从机器学习的关键元素出发,一步一步推导出GBDT算法背后的理论基础,读者可以从这个过程中了解到GBDT算法的来龙去脉。对于该算法的工程实现,本文也有较好的指导意义,实际上对机器学习关键概念元素的区分对应了软件工程中的“开放封闭原则”的思想,基于此思想的实现将会具有很好的模块独立性和扩展性。
最初发布在作业部落:https://www.zybuluo.com/yxd/note/611571 阅读全文
摘要:
近几年,深度学习在图像、语音和NLP等领域取得了巨大的成功。学术界和工业界都争相在该领域进行着探索和研究。在所有大举深度学习大旗的公司中,Google公司无疑是举得最高的,口号喊得最响亮的那一个。2013年末,Google发布了基于深度学习方法打造的word2vec工具,引起了一帮人的热捧。Word... 阅读全文
摘要:
C++中的operator主要有两个作用,一是操作符的重载,一是自定义对象类型的隐式转换。对于操作符的重载,许多人都不陌生,但是估计不少人都不太熟悉operator的第二种用法,即自定义对象类型的隐式转换,我们下面就用以下这个小例子温故一下这两种用法: 1 #include 2 #include ... 阅读全文
摘要:
排序 去重 面试题 shell 阅读全文
摘要:
我们通常会遇到这样的需求:通过C++或其他较底层的语言实现了一个复杂的功能模块,需要搭建一个基于Web的Demo,方法查询数据。由于Python语言的强大和简洁,其用来搭建Demo非常合适,Flask框架和jinja2模块功能为python提供了方便的web开发能力。同时,python能够很方便的同... 阅读全文
摘要:
一、字符编码简介1. ASCII码在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,... 阅读全文
摘要:
忽如一夜春风来,无人不谈大数据。大数据就像前两年的云计算一样,是一个时下被炒得很火的概念。那么什么是大数据,大数据是如何定义的,大数据处理技术有哪些,大数据能给我们带来什么益处?虽然我不知道现在这些概念是如何被炒作的,但是作为一名互联网行业的从业者,作为一个大数据技术的实践者,根据自己的理解和经验发... 阅读全文
摘要:
先来说说什么是O2O(online to offline)商业模式。创新工场CEO李开复在提及O2O模式时指出,“你如果不知道O2O至少知道团购,但团购只是冰山一角,只是第一步”。O2O营销模式又称离线商务模式,是指线上营销线上购买带动线下经营和线下消费。O2O通过打折、提供信息、服务预订等方式,把... 阅读全文