06 2019 档案
摘要:A Generative Entity-Mention Model for Linking Entities with Knowledge Base 一.主要方法 提出了一种生成概率模型,叫做entity-mention model. Explanation: In our model, each
阅读全文
摘要:learning to link with wikipedia 一、本文目标: 如何自动识别非结构化文本中提到的主题,并将其链接到适当的Wikipedia文章中进行解释。 二、主要借鉴论文: Mihalcea and Csomai Wikify!: linking documents to ency
阅读全文
摘要:https://mirrors.tuna.tsinghua.edu.cn/apache/
阅读全文
摘要:Spark数据分区调研 Spark以textFile方式读取文件源码 textFile方法位于 spark-core_2.11/org.apache.spark.api.java/JavaSparkContent.scala 参数分析: path :String是一个URI,可以是HDFS、本地文件
阅读全文
摘要:第1章 Zookeeper入门 1.1 概述 Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目。 1.2 特点 1.3 数据结构 1.4 应用场景 提供的服务包括:统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。 第2章 Zookeep
阅读全文
摘要:转载自:https://www.cnblogs.com/itboys/p/7603634.html 在HBase读写时,相同Cell(RowKey/ColumnFamily/Column相同)并不保证在一起,甚至删除一个Cell也只是写入一个新的Cell,它含有Delete标记,而不一定将一个Cel
阅读全文
摘要:一、安装Python Windows平台下: 进入Python官网下载页面下载 python(注意自己的电脑是64位还是32位), 目前python一般有2.7版本和3.x版本,如果是从事开发,建议2.7版本和最新的3.x版本一起下载安装(当然,看个人喜好)。安装路径最好默认就可以了,建议不要修改安
阅读全文
摘要:统计某文件夹下文件的个数 ls -l |grep "^-"|wc -l 统计某文件夹下目录的个数 ls -l |grep "^d"|wc -l 统计文件夹下文件的个数,包括子文件夹里的 ls -lR|grep "^-"|wc -l
阅读全文
摘要:https://blog.csdn.net/wangqianyilynn/article/details/75576815
阅读全文