摘要:
# coding=gbk import time from sklearn import metrics import pickle as pickle import pandas as pd '''实现对'NB', 'KNN', 'LR', 'trees', 'tree', 'SVM','SVMCV'模型的简单调用。''' # Multinomial Naive Bayes Classif... 阅读全文
摘要:
import jieba seg_list = jieba.cut("我来到北京清华大学", cut_all=True, HMM=False) print("Full Mode: " + "/ ".join(seg_list)) # 全模式 seg_list = jieba.cut("我来到北京清华大学", cut_all=False, HMM=True) print("Default Mo... 阅读全文
摘要:
PDF读取#!/usr/bin/env python #-*- coding:utf-8 -*- from pdfminer.pdfparser import PDFParser from pdfminer.pdfdocument import PDFDocument from pdfminer.pdfpage import PDFPage from pdfminer.pdfint... 阅读全文
摘要:
进入hbase 部分命令清单 查询服务器状态 status 查询hbase版本 version 1. 创建一个表 2. 列出所有的表 3. 获得表的描述 4. 删除一个列族 disable alter enable 5. 查看表是否存在 6. 判断表是否为‘enable’ 判断表是否为‘disabl 阅读全文
摘要:
1、原始数据类型和运算符 # 整数 3 # => 3 # 算术没有什么出乎意料的 1 + 1 # => 2 8 - 1 # => 7 10 * 2 # => 20 # 但是除法例外,会自动转换成浮点数 35 / 5 # => 7.0 5 / 3 # => 1.6666666666666667 # 整 阅读全文
摘要:
hdfs基本操作 1、查询命令 hadoop dfs -ls / 查询/目录下的所有文件和文件夹 hadoop dfs -ls -R 以递归的方式查询/目录下的所有文件 2、创建文件夹 hadoop dfs -mkdir /test 创建test文件夹 3、创建新的空文件 hadoop dfs -t 阅读全文