04 2016 档案
摘要:摘要:本文基于PayPal高级工程总监Anil Madan写的大数据文章,其中涵盖100篇大数据的论文,涵盖大数据技术栈(数据存储层、键值存储、面向列的存储、流式、交互式、实时系统、工具、库等),全部读懂你将会是大数据的顶级高手。作者通过引用Anil Madan原文和CSDN的译文为基础。进行中英对照整理所得。旨在技术传播,分享更多技术爱好者。为尊重原文,本人将原文放置最醒目之处:英文:100 open source Big Data architecture papers for data professionals.中文:PayPal高级工程总监:读完这100篇论文 就能成大数据高手.(本文引用整编所得,转载说明出处:读完这100篇论文 就能成大数据高手.)
阅读全文
摘要:摘要:搜索已经作为生活中不可缺少的一部分,诸如:百度、google、还是在微信上寻找好友或者通过一段文本查找关键字。另外亚马逊、京东、天猫、苏宁等电商在搜索中也是别有洞天(多面搜索等)。对于开发人员,搜索往往是大部分应用的关键功能,特别是对大规模文本数据驱动应用更是如此。另一类搜索像语音智能检索,其采用分类、聚类、神经网络等方法进行模型评估,反馈给用户比较理想的匹配结果,这里需要强调的是其采用评分机制反馈的模糊近似查询结果,与传统精确采用是不一样的。这种结果的反馈评分主要依托正确率和召回率。这里自己构建搜索工具好处在于:灵活性、开发费用低、自己更了解自己的搜索工具、价格当然是免费的啦。本文作者花费大量时间,经过资料收集,研究和实验所得,旨在技术分享。(本文原创,转载需说明出处:自己动手搭建搜索工具。)
阅读全文
搜索
积分与排名
- 积分 - 446896
- 排名 - 1696
随笔分类 (270)
- Algorithm(13)
- ASP.NET(15)
- C#(20)
- Data Mining(15)
- Database(10)
- Database Cluster(13)
- Domain Ontology(2)
- Form(7)
- Hadoop(2)
- Java(4)
- JavaScript(5)
- Linux(2)
- Machine learning(16)
- NLP(40)
- PHP(1)
- project summary(15)
- Python(33)
- software Testing(4)
- SPSS(1)
- statistics(14)
- Thinking(6)
- Tools(11)
- web design(6)
- 学习笔记(15)
- 更多
随笔档案 (218)
- 2019年6月(15)
- 2019年5月(2)
- 2019年4月(1)
- 2018年12月(3)
- 2018年11月(1)
- 2018年10月(5)
- 2018年9月(5)
- 2018年8月(3)
- 2018年7月(4)
- 2017年10月(5)
- 2017年8月(4)
- 2017年7月(5)
- 2017年5月(3)
- 2017年4月(1)
- 2017年3月(1)
- 2017年1月(1)
- 2016年12月(3)
- 2016年11月(14)
- 2016年10月(13)
- 2016年9月(1)
- 2016年8月(5)
- 2016年7月(9)
- 2016年6月(3)
- 2016年4月(2)
- 2016年3月(6)
- 2016年2月(1)
- 2016年1月(1)
- 2015年11月(4)
- 2015年10月(10)
- 2015年9月(1)
- 2015年8月(5)
- 2015年7月(13)
- 2014年10月(1)
- 2014年8月(5)
- 2014年7月(4)
- 2013年6月(6)
- 2013年5月(3)
- 2013年3月(20)
- 2013年2月(1)
- 2013年1月(3)
- 2012年12月(2)
- 2012年11月(23)
- 更多
文章档案 (1)
阅读排行榜
- 1. 【NLP】十分钟快览自然语言处理学习总结(66628)
- 2. Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之ORACLE集群概念和原理(二)(50497)
- 3. Docker如何部署Python项目(42052)
- 4. 【NLP】干货!Python NLTK结合stanford NLP工具包进行文本处理(39089)
- 5. 【程序员眼中的统计学(7)】正态分布的运用:正态之美(30815)
- 6. 一步步教你轻松学K-means聚类算法(30231)
- 7. 【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之集群概念介绍(一)(28320)
- 8. 【Oracle 集群】Oracle 11G RAC教程之集群安装(七)(25639)
- 9. 数据挖掘150道笔试题(24623)
- 10. 【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之RAC 工作原理和相关组件(三)(21212)
评论排行榜
- 1. 【基于WPF+OneNote+Oracle的中文图片识别系统阶段总结】之篇二:基于OneNote难点突破和批量识别(34)
- 2. 【ASP.NET】演绎GridView基本操作事件(22)
- 3. 【基于WinForm+Access局域网共享数据库的项目总结】之篇三:Access远程连接数据库和窗体打包部署(17)
- 4. 【吾悟】《易经》有感程序人生(17)
- 5. 【@伏草惟存@】7年系列博文精选(10)
- 6. PayPal高级工程总监:读完这100篇论文 就能成大数据高手(附论文下载)(10)
- 7. 【基于WinForm+Access局域网共享数据库的项目总结】之篇一:WinForm开发总体概述与技术实现(10)
- 8. 【基于WPF+OneNote+Oracle的中文图片识别系统阶段总结】之篇四:关于OneNote入库处理以及审核(9)
- 9. 【程序员眼中的统计学(7)】正态分布的运用:正态之美(8)
- 10. 【项目管理】GitHub使用操作指南(6)
最新评论
- 1. Re:【Machine Learning】决策树案例:基于python的商品购买能力预测系统
代码可否重新提供下载
- --寻找普拉多
- 2. Re:【本/硕毕业生】开题报告及论文指导思路和撰写事项的整理
总结的很到位,非常有用,感谢
- --minepy
- 3. Re:【基于WinForm+Access局域网共享数据库的项目总结】之篇一:WinForm开发总体概述与技术实现
MYHelper.这是怎么出来的,文章也看来不下10遍了,也百度过,没有找到答案,楼主能给点提示吗?
- --尘戢
- 4. Re:【NLP】Python实例:基于文本相似度对申报项目进行查重设计
有公开的代码吗?
- --ls0311
- 5. Re:Python数据预处理:机器学习、人工智能通用技术(1)
大佬们,怎么样才能加入群聊学习更多的知识,436303759这个群好像进不来
- --姜泽
- 6. Re:Docker如何部署Python项目
图裂了。。。
- --kpbiao
- 7. Re:Docker如何部署Python项目
说实话,看到的为数不多的把docker讲的如此透彻的文章之一。赞赞赞!
- --星星柯北
- 8. Re:【吾悟】《易经》有感程序人生
- 写的太好了!!!
- --民工也Coding
- 9. Re:Docker如何部署Python项目
- 支持支持,我也正在学DOCKER。。。
- --牛腩
- 10. Re:一步步教你轻松学决策树算法
- 写的非常详细,教程的结构也很合理,内容易于接受。
- --enternallove