06 2019 档案

摘要:Python_uuid 学习总结1. 背景知识: UUID: 通用唯一标识符 ( Universally Unique Identifier ), 对于所有的UUID它可以保证在空间和时间上的唯一性. 它是通过... 阅读全文
posted @ 2019-06-27 18:01 sowhat1412 阅读(1889) 评论(0) 推荐(0)
摘要:Hive 没有行级别的数据的增删改,往表中装载数据唯一途径就是 使用大量数据进行装载,可以通过load 可以 insert动态分区 ,动态静态所以hive提供了一个动态分区功能,其可以基于查询参数的位置去推断分区... 阅读全文
posted @ 2019-06-27 13:53 sowhat1412 阅读(787) 评论(0) 推荐(0)
摘要:一、先下载好SourceCounter小工具。解压,然后直接打开文件夹中的SourceCounter.exe。如果没有找到此工具的下载链接,点这里下载 二、选择代码类型,勾选上所有类型 三、双击点开后,选择文件夹... 阅读全文
posted @ 2019-06-26 15:40 sowhat1412 阅读(92) 评论(0) 推荐(0)
摘要:在一般的 linux 或者 unix 系统中, 都可以通过编辑 bashrc 和 profile 来设置用户的工作环境, 很多文章对于 profile 和 bashrc 也都有使用, 但究竟每个文件都有什么作用和... 阅读全文
posted @ 2019-06-26 11:16 sowhat1412 阅读(195) 评论(0) 推荐(0)
摘要:前面在讲述创建表的语句时,省略了一些内容,更加完整的语法如下CREATE TABLE t1(...) STORED AS TEXTFILE;最后的STORED AS 子句,指的是Hive数据文件的存储格式,这里使... 阅读全文
posted @ 2019-06-25 19:22 sowhat1412 阅读(621) 评论(0) 推荐(0)
摘要:机器学习实战代码阅读目录知识点 感知机 k近邻法 朴素贝叶斯 决策树 logistic回归和最大熵模型 支持向量机 提升方法 EM算法 隐马尔可夫模型(HMM) 统计学习方法总结 神经网络 K-Means Bag... 阅读全文
posted @ 2019-06-21 10:44 sowhat1412 阅读(1060) 评论(0) 推荐(0)
摘要:这篇博客是自己在学习生成模型与判别模型过程中的一些记录,整理了相关的文章后写成,感谢前辈们的辛苦总结简单的说,生成模型是从大量的数据中找规律,属于统计学习;而判别模型只关心不同类型的数据的差别,利用差别来分类。两... 阅读全文
posted @ 2019-06-19 17:30 sowhat1412 阅读(184) 评论(0) 推荐(0)
摘要:贝叶斯定理、精准推断、最大似然估计、连续特征参数估计、EM算法 参考link,GMM通俗理解先验概率:事情未发生,根据以往经验估计事情发生概率后验概率:事情已经发生,根据事实去估计最可能导致此事发生的参数。最大... 阅读全文
posted @ 2019-06-18 08:58 sowhat1412 阅读(280) 评论(0) 推荐(0)
摘要:threading.Thread().join()方法和queue.join)()的区别线程的join()是主线程等待子线程的执行完毕再执行, 队列的join()是主线程等待队列中的任务都消耗完再执行。Pytho... 阅读全文
posted @ 2019-06-14 14:40 sowhat1412 阅读(278) 评论(0) 推荐(0)