左手中倒影

hadoop技术控 大数据解决方案 hanlp研究爱好者
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2018年4月17日

摘要: 在GitHub十周年之际,大快搜索AI研究小组的,自然语言处理专家Hancks所主持的HanLP开源项目,全球用户量首次超过了斯坦福大学的CoreNLP,以及老牌的自然语言处理开包Ansj,成为全球范围内最受开发人员喜爱的自然语言处理技术。 阅读全文

posted @ 2018-04-17 14:01 左手中倒影 阅读(274) 评论(0) 推荐(0) 编辑

2018年4月16日

摘要: 大快的大数据通用计算平台(DKHadoop),已经集成相同版本号的开发框架的全部组件。关于DKhadoop大数据处理平台的案例,其实感兴趣的可以去大快的网站上查询一下,里面有很多案例分享。个人所知的是DKhadoop的政务大数据处理解决方案非常好!大家也可以在大快网站上查询一下这方面的方案资料。 阅读全文

posted @ 2018-04-16 16:38 左手中倒影 阅读(1150) 评论(0) 推荐(0) 编辑

2018年4月12日

摘要: 这里要分享的HanLP是我在学习使用大快DKhadoop大数据一体化平台时使用到的自然语言处理技术,使用这个组建可以很高效的进行自然语言的处理工作,比如进行文章摘要,语义判别以及提高内容检索的精确度和有效性等。 本想找个通俗的案例来介绍一下HanLP,一时间也没想到什么好的案例,索性就从HanLp数据结构HE 分词简单介绍下吧。 阅读全文

posted @ 2018-04-12 15:06 左手中倒影 阅读(320) 评论(0) 推荐(0) 编辑

2018年4月8日

摘要: 大数据的时代已经来了,信息的爆炸式增长使得越来越多的行业面临这大量数据需要存储和分析的挑战。Hadoop作为一个开源的分布式并行处理平台,以其高拓展、高效率、高可靠等优点越来越受到欢迎。这同时也带动了hadoop商业版的发行。这里就通过大快DKhadoop为大家详细介绍一下hadoop大数据平台架构内容。 阅读全文

posted @ 2018-04-08 15:59 左手中倒影 阅读(3983) 评论(0) 推荐(0) 编辑

2018年3月30日

摘要: 目前国内的hadoop商业发行版也是比较多,这些hadoop商业版大部分都是由国外发行的,纯国产的发行版不是很多,比如DKhadoop,可以说是目前国内自主做hadoop商业版比较好的了。下面就以大快搜索DKhadoop为例来给大家介绍一下hadoop框架结构! 阅读全文

posted @ 2018-03-30 17:00 左手中倒影 阅读(1249) 评论(0) 推荐(1) 编辑

2018年3月27日

摘要: Hadoop集群环境搭建是很多学习hadoop学习者或者是使用者都必然要面对的一个问题,网上关于hadoop集群环境搭建的博文教程也蛮多的。对于玩hadoop的高手来说肯定没有什么问题,甚至可以说事“手到擒来”的事情,但对于hadoop的初学者来说,hadoop集群环境的搭建着实压力不小。 阅读全文

posted @ 2018-03-27 16:46 左手中倒影 阅读(307) 评论(0) 推荐(1) 编辑

2018年3月26日

摘要: NLP是什么 在计算机领域, NLP(Natural Language Processing),也就是人们常说的「自然语言处理」,就是研究如何让计算机读懂人类语言。这包括,既要能让计算机理解自然语言文本的意义,也能以自然语言文本来表达给定的深层的意图、思想等。所以,这项技术往往体现了人工智能的最高任 阅读全文

posted @ 2018-03-26 15:43 左手中倒影 阅读(402) 评论(0) 推荐(1) 编辑

2018年3月24日

摘要: 我们目前在用的hadoop版本并不是原生态的版本,我们在用的是国内的一款商业发行版,叫DKhadoop。大快搜索推出的一款原生态开发的Hadoop集成生态环境。从使用的效果上看DKhadoop与开源环境是可以做到完全兼容的。准备过段时间抽个空,试着写一下以DKhadoop为切入点关于学习hadoop需要掌握什么基础。 阅读全文

posted @ 2018-03-24 17:41 左手中倒影 阅读(1321) 评论(0) 推荐(1) 编辑

2018年3月23日

摘要: Dkhadoop发行版是我目前接触的以及使用一个版本。与市场的其他第三方的发行版本相比较,整合程度要更高,但同样也保持了开源系统的全部优点。综合目前使用的情况看,在性能上相较于以往使用的一些第三方hadoop发行版要提升很多的!关于DKhadoop发行版的问题,感兴趣的可以自己去查阅收集一些资料看看。 阅读全文

posted @ 2018-03-23 11:32 左手中倒影 阅读(1333) 评论(0) 推荐(1) 编辑

2018年3月22日

摘要: 一、Hadoop是什么? 首次听到hadoop这次单词,相信很多人跟我当时是一样,不免心中画上一个大大的问号——这是什么东西?Hadoop是什么?百度百科的解释是:Hadoop是一个由Apache基金会所开发的分布式系统基础架构。换句话说就是hadoop是一个能够对大量数据进行分布式处理的软件框架。 阅读全文

posted @ 2018-03-22 16:12 左手中倒影 阅读(708) 评论(0) 推荐(1) 编辑