上一页 1 ··· 5 6 7 8 9 10 下一页

2018年3月5日

[Machine Learning & Algorithm] 朴素贝叶斯算法(Naive Bayes)

摘要: 阅读目录 一、病人分类的例子 二、朴素贝叶斯分类器的公式 三、账号分类的例子 四、性别分类的例子 阅读目录 一、病人分类的例子 二、朴素贝叶斯分类器的公式 三、账号分类的例子 四、性别分类的例子 生活中很多场合需要用到分类,比如新闻分类、病人分类等等。 本文介绍朴素贝叶斯分类器(Naive Baye 阅读全文

posted @ 2018-03-05 18:13 NothingLZ 阅读(310) 评论(0) 推荐(0) 编辑

2018年3月3日

TF-IDF与余弦相似性的应用(三):自动摘要

摘要: 有时候,很简单的数学方法,就可以完成很复杂的任务。 这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出关键词和相似文章。虽然它们算不上效果最好的方法,但肯定是最简便易行的方法。 今天,依然继续这个主题。讨论如何通过词频,对文章进行自动摘要(Automatic summarization)。 阅读全文

posted @ 2018-03-03 10:51 NothingLZ 阅读(236) 评论(0) 推荐(0) 编辑

2018年3月2日

TF-IDF与余弦相似性的应用(二):找出相似文章

摘要: 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 为了找出相似的文章,需要用到"余弦相似性"(cosine similiarity)。下面,我举一个例子来说明,什么是"余弦相似性"。 为 阅读全文

posted @ 2018-03-02 12:00 NothingLZ 阅读(183) 评论(0) 推荐(0) 编辑

TF-IDF与余弦相似性的应用(一):自动提取关键词

摘要: 有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到? 这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,但是出乎意料的是,有一个非常简单的经典算法,可以给出令人相当满意的结果。它简单到都 阅读全文

posted @ 2018-03-02 11:52 NothingLZ 阅读(196) 评论(0) 推荐(0) 编辑

flume简介

摘要: 组件介绍: 代理 Flume Agent agent source agent channel 监控网络端口使用 启动命令:flume-ng agent -n a1 -c $FLUME_HOME/conf -f $FLUME_HOME/conf/example.conf -Dflume.root.l 阅读全文

posted @ 2018-03-02 00:00 NothingLZ 阅读(157) 评论(0) 推荐(0) 编辑

2018年2月21日

streaming简介

摘要: mapreduce和hdfs采用java实现,默认提供java编程接口 streaming框架允许任何程序语言实现的程序在hadoop mapreduce中使用 streaming方便已有的程序向hadoop平台移植 streaming原理图 streaming局限 streaming默认只能处理文 阅读全文

posted @ 2018-02-21 22:52 NothingLZ 阅读(692) 评论(0) 推荐(0) 编辑

2018年2月8日

HBase启动后RegionServer自动挂原因及解决办法

摘要: zookeeper在同步和管理集群时依赖节点系统时间,每隔一定周期zookeeper master会监测所有节点的连接状态。所以解决办法就是利用ntp对集群局域网进行时间同步。 CentOS设置系统时间与网络时间同步 Linux的时间分为System Clock(系统时间)和Real Time Cl 阅读全文

posted @ 2018-02-08 20:41 NothingLZ 阅读(425) 评论(0) 推荐(0) 编辑

2018年2月7日

Python3:sorted()函数及列表中的sort()函数

摘要: 一、sort,sorted函数介绍: Sort函数是list列表中的函数,而sorted可以对list或者iterator进行排序。 下面我们使用help来查看他们的用法及功能: sort: sorted: Python3.x: Python2.x: 好吧,Python3.x和Python2.x的s 阅读全文

posted @ 2018-02-07 23:06 NothingLZ 阅读(419) 评论(0) 推荐(0) 编辑

2017年11月2日

说明os,sys模块不同?并列举常用的模块方法

摘要: os: This module provides a portable way of usingoperating system dependent functionality. 翻译:提供一种方便的使用操作系统函数的方法。 sys:This module provides access to so 阅读全文

posted @ 2017-11-02 10:31 NothingLZ 阅读(353) 评论(0) 推荐(0) 编辑

2017年8月10日

django学习笔记

摘要: # 创建Django工程 django-admin startproject 【工程名称】 # 运行Django功能 python manage.py runserver 127.0.0.1:8000 # 创建app python manage.py startapp cmdb python man 阅读全文

posted @ 2017-08-10 15:24 NothingLZ 阅读(174) 评论(0) 推荐(0) 编辑

上一页 1 ··· 5 6 7 8 9 10 下一页

导航