摘要: 1、使用root账户创建用户 # 创建用户lzq,默认无密码 [root@localhost ~]# useradd lzq # 为用户lzq创建密码,密码少于8个字符需要输入两次 [root@localhost ~]# passwd lzq 更改用户 lzq 的密码 。 新的 密码: 无效的密码: 阅读全文
posted @ 2019-12-17 14:06 cknds 阅读(371) 评论(0) 推荐(0) 编辑
摘要: #-*- encoding: utf-8 -*- ''' @describe: 读取mysql数据库的工具类 ''' import sys sys.path.append("/home/hadoop/crawler") from configs import config import MySQLd 阅读全文
posted @ 2019-12-16 23:44 cknds 阅读(1639) 评论(0) 推荐(0) 编辑
摘要: 1.python处理Excel的几种方法: 方法一:利用pandas、方法二、xlrd和xlwt两个模块分别用来读Excel和写Excel,只支持.xls和.xlsx格式,xlutils模块可以同时读写一个已存在的Excel文件,依赖于xlrd和xlwt方法三、openpyxl(可读写excel表) 阅读全文
posted @ 2019-12-16 17:35 cknds 阅读(2718) 评论(0) 推荐(0) 编辑
摘要: 1 软件准备 安装环境:系统是CentOS7,64位,安装过程中的所有软件需适应这个系统。本文是使用root用户安装。 使用linux命令可查看自己的操作系统: 注意:如果在虚拟机上安装CentOS7,使用了最小安装,在启动CM的时候可能可能会报pstree找不到的错误。 1 [root@maste 阅读全文
posted @ 2019-12-14 22:38 cknds 阅读(1193) 评论(0) 推荐(0) 编辑
摘要: crontab命令说明如下:crontab命令被用来提交和管理用户的需要周期性执行的任务,与windows下的计划任务类似,当安装完成操作系统后,默认会安装此服务工具,并且会自动启动crond进程,crond进程每分钟会定期检查是否有要执行的任务,如果有要执行的任务,则自动执行该任务。 # -e:编 阅读全文
posted @ 2019-12-13 11:25 cknds 阅读(886) 评论(0) 推荐(0) 编辑
摘要: 根据key值遍历 1 >>> a 2 {'a': '1', 'b': '2', 'c': '3'} 3 >>> for key in a: 4 print(key+':'+a[key]) 5 6 a:1 7 b:2 8 c:3 9 >>> for key in a.keys(): 10 print( 阅读全文
posted @ 2019-12-12 10:03 cknds 阅读(14291) 评论(0) 推荐(1) 编辑
摘要: 1. mysql, oracle ,sqlserver各自的默认端口号 sqlserver默认端口号为:1433 URL:"jdbc:microsoft:sqlserver://localhost:1433;DatabaseName=dbname" DRIVERNAME:"com.microsoft 阅读全文
posted @ 2019-12-12 09:29 cknds 阅读(740) 评论(0) 推荐(0) 编辑
摘要: 一。 数组要比列表效率高很多 numpy高效的处理数据,提供数组的支持,python默认没有数组。pandas、scipy、matplotlib都依赖numpy。 pandas主要用于数据挖掘,探索,分析 matplotlib用于作图,可视化 scipy进行数值计算,如:积分,傅里叶变换,微积分 s 阅读全文
posted @ 2019-12-11 16:46 cknds 阅读(1444) 评论(0) 推荐(0) 编辑
摘要: 聚类指的是把集合,分组成多个类,每个类中的对象都是彼此相似的。K-means是聚类中最常用的方法之一,它是基于点与点距离的相似度来计算最佳类别归属。 在使用该方法前,要注意(1)对数据异常值的处理;(2)对数据标准化处理(x-min(x))/(max(x)-min(x));(3)每一个类别的数量要大 阅读全文
posted @ 2019-12-11 16:30 cknds 阅读(17849) 评论(1) 推荐(1) 编辑
摘要: 1.随机选择 选择初始质心,我们可以用最基本的随机方法,但是这种方法会导致一个局部最优解问题。即,将一个比较大的簇分裂,同时将两个较小的簇进行合并。 由于K-Means算法具有不稳定性,初始质心选择不同,结果也不同。所以解决局部最优的方法,其一可以多次运行算法,选择具有最小SSE值的那组作为最终解。 阅读全文
posted @ 2019-12-11 15:25 cknds 阅读(3782) 评论(0) 推荐(0) 编辑