会员
T恤
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Tensor
欢迎关注微信公众号:大数据与知识图谱
博客园
首页
新随笔
联系
订阅
管理
随笔 - 119
文章 - 0
评论 - 18
阅读 -
19万
2021年9月29日
数据湖是下一代数据仓库吗?
摘要: Aberdeen 的一项调查表明,实施数据湖的组织比同类公司在有机收入增长方面高出 9%。这些领导者能够进行新类型的分析,例如通过日志文件、来自点击流的数据、社交媒体以及存储在数据湖中的互联网连接设备等进行机器学习。这有助于他们通过吸引和留住客户、提高生产力、主动维护设备以及做出明智的决策来更快地识
阅读全文
posted @ 2021-09-29 17:57 派。
阅读(242)
评论(0)
推荐(0)
2020年12月9日
Hive NULL比较
摘要: NULL值比较 select case when null > '1' then 1 when null < '1' then 2 when null = '1' then 3 when null != '1' then 4 when null <> '1' then 5 else 6 end 结果
阅读全文
posted @ 2020-12-09 20:19 派。
阅读(642)
评论(0)
推荐(0)
2019年9月1日
实战关键词提取
摘要: 我要把人生变成科学的梦,然后再把梦变成现实。——居里夫人 概述 关键词是代表文章重要内容的一组词,在文献检索、自动文摘、文本聚类/分类等方面有着重要的应用。现实中大量的文本不包含关键词,这使得便捷得获取文本信息更困难,所以自动提取关键词技术具有重要的价值和意义。 关键词提取分类 有监督 无监督 有监
阅读全文
posted @ 2019-09-01 23:02 派。
阅读(3344)
评论(0)
推荐(0)
2019年8月18日
图论——一个迷人的世界
摘要: 虽然不允许我们看透自然界本质的秘密,从而认识现象的真实原因,但仍可能发生这样的情形:一定的虚构假设足以解释许多现象。 ——莱昂哈德·欧拉 起源 说到图论,不得不说数学大神欧拉了,图论起源于一个非常经典的问题——柯尼斯堡七桥问题。 在18世纪初普鲁士柯尼斯堡有一条大河,河中有两个小岛。全城被大河分割成
阅读全文
posted @ 2019-08-18 08:48 派。
阅读(1047)
评论(0)
推荐(0)
2019年8月11日
中文分词工具——jieba
摘要: 汉字是智慧和想象力的宝库。 ——索尼公司创始人井深大 简介 在英语中,单词就是“词”的表达,一个句子是由空格来分隔的,而在汉语中,词以字为基本单位,但是一篇文章的表达是以词来划分的,汉语句子对词构成边界方面很难界定。例如:南京市长江大桥,可以分词为:“南京市/长江/大桥”和“南京市长/江大桥”,这个
阅读全文
posted @ 2019-08-11 16:34 派。
阅读(2189)
评论(0)
推荐(0)
2019年8月3日
Python数据科学利器
摘要: 每个工具都带有用来创造它的那种精神。 —— 海森堡《物理学和哲学》 Anaconda Anaconda是一个python的科学计算发行版,其附带了一大批常用的数据科学包,不用再使用pip安装数据科学包,再也不用为各种数据科学包版本和依赖冲突发愁了,哈哈。 conda conda和pip类似,cond
阅读全文
posted @ 2019-08-03 11:06 派。
阅读(351)
评论(0)
推荐(0)
2019年7月19日
知识图谱发展历程
摘要: 我似乎总是想以最节能的方式,用自然界里最平常的东西来造各种东西。—— 艾伦·麦席森·图灵 发展历程 知识图谱(Knowledge Graph)的历程发展可以追溯到20世纪70年代诞生的专家系统,专家系统是一个具有大量的专门知识与经验的程序系统,它应用人工智能技术和计算机技术,根据某领域一个或多个专家
阅读全文
posted @ 2019-07-19 13:21 派。
阅读(5173)
评论(0)
推荐(0)
2019年7月3日
数据结构与算法《五》
摘要: 惊奇就是科学的种子。—— 爱迪生 LeetCode: 合并两个有序数组 给定两个有序整数数组 nums1 和 nums2,将 nums2 合并到 nums1 中,使得 nums1 成为一个有序数组。 说明: 初始化 nums1 和 nums2 的元素数量分别为 m 和 n。 你可以假设 nums1
阅读全文
posted @ 2019-07-03 20:34 派。
阅读(207)
评论(0)
推荐(0)
2019年6月22日
数据结构与算法《四》
摘要: 一切推理都必须从观察与实验得来。 —— 伽利略·伽利雷 LeetCode: 搜索二维矩阵 II 编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target。该矩阵具有以下特性: 每行的元素从左到右升序排列。 每列的元素从上到下升序排列。 示例: 现有矩阵 matrix 如
阅读全文
posted @ 2019-06-22 11:35 派。
阅读(163)
评论(0)
推荐(0)
数据结构与算法《二》
摘要: 真理只有一个,它不在宗教中,而是在科学中。 达芬奇 LeetCode: 只出现一次数字 给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。 说明: 使用线性时间复杂度,不使用额外空间。 示例: 分析: 由于对时间复杂度和空间有限制,显然不能进行两次
阅读全文
posted @ 2019-06-22 11:34 派。
阅读(123)
评论(0)
推荐(0)
下一页
公告
<
2025年4月
>
日
一
二
三
四
五
六
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1
2
3
4
5
6
7
8
9
10
点击右上角即可分享