上一页 1 ··· 4 5 6 7 8
摘要: Reducer receives (key, values) pairs and aggregate values to a desired format, then write produced (key, value) pairs back into HDFS. E.g. Input: (ter 阅读全文
posted @ 2018-09-01 17:41 LexLuc 阅读(200) 评论(0) 推荐(0) 编辑
摘要: Mapper maps input key/value pairs into intermediate key/value pairs. E.g. Input: (docID, doc) Output: (term, 1) Mapper Class Prototype: Special Data T 阅读全文
posted @ 2018-09-01 16:41 LexLuc 阅读(288) 评论(0) 推荐(0) 编辑
摘要: ``` !/usr/bin/python3 coding: UTF 8 import requests import time import gzip import urllib import json import hashlib import base64 def audio_dictation 阅读全文
posted @ 2018-08-30 01:15 LexLuc 阅读(1198) 评论(0) 推荐(0) 编辑
摘要: Filter Filter 常用于从大量文本、数据中提取需求的部分。下面介绍几个常用的 filter 命令。 cut cut -c 5-8 textfile.txt # 切出 textfile.txt 中每行的第 5 到第 8 个 character cut -f2-4 -d',' text 阅读全文
posted @ 2018-08-11 17:04 LexLuc 阅读(2646) 评论(0) 推荐(0) 编辑
摘要: 概率论复习 概率(Probability) 频率学派(Frequentist) :由大量试验得到的期望频率(致命缺陷:有些事情无法大量试验,例如一封邮件是垃圾邮件的概率,雷达探测的物体是一枚导弹的概率); 贝叶斯学派(Bayesian) :基于已有信息而对预测结果的不确定性; 离散随机变量(Disc 阅读全文
posted @ 2018-08-04 14:04 LexLuc 阅读(445) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8
点击右上角即可分享
微信分享提示