上一页 1 2 3 4 5 6 7 8 ··· 10 下一页
摘要: 1 isinstance(object, class-or-type-or-tuple) ->bool 内置函数isinstance有两个参数,第一个参数是待检测的对象,第二个参数是对象类型,可以是单个类型,也可以是元组,返回的bool类型 如果待检测对象属于第二个参数,则返回True;否则,返回F 阅读全文
posted @ 2018-09-05 10:21 夕阳下的无名草 阅读(162) 评论(0) 推荐(0) 编辑
摘要: RDD的两种操作 1.Tansformation(转化操作):返回值还是一个RDD 2.Action(行动操作):返回值不是一个RDD 第一种Transformation是返回一个新的RDD,如map(),filter()等。这种操作是lazy(惰性)的,即从一个RDD转换生成另一个RDD的操作不是 阅读全文
posted @ 2018-09-04 22:24 夕阳下的无名草 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 1 优化器的算法原则,列的偏移量决定性能,列越靠后,访问的开销越大,由于count(*) 与偏移量无关,所以count(*) 最快,count(最后列)最慢 阅读全文
posted @ 2018-08-22 08:28 夕阳下的无名草 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 1 文件的基本操作 2 创建文件夹 3 获取当前目录 4 改变默认目录 5获取目录列表 6 删除文件夹 阅读全文
posted @ 2018-07-25 15:42 夕阳下的无名草 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 1 xlsx文件转csv文件 2 使用第三方库pandas将xlsx文件转csv文件 3 csv文件转换成xlsx文件 4 使用pandas将csv文件转成xlsx文件 阅读全文
posted @ 2018-07-20 09:09 夕阳下的无名草 阅读(22863) 评论(1) 推荐(0) 编辑
摘要: ValueError: Some of types cannot be determined by the first 100 rows, please try again with sampling 在spark中试图将RDD转换成DataFrame时,有时会提示ValueError: Some 阅读全文
posted @ 2018-07-11 19:19 夕阳下的无名草 阅读(743) 评论(0) 推荐(0) 编辑
摘要: Python包含以下函数: list方法 python的高级特性切片&截取 加-(负号)表示取倒数第几个 每隔整数个元素取一个 list1[::2] 结果 [1, 10, 5, 7] 迭代(直接在对象上) 列表生成器 加判断语句 [x for x in xrange(1,11) if x % 2 = 阅读全文
posted @ 2018-07-06 08:15 夕阳下的无名草 阅读(210) 评论(0) 推荐(0) 编辑
摘要: python数据分析工具pandas中DataFrame和Series作为主要的数据结构. 本文主要是介绍如何对DataFrame数据进行操作并结合一个实例测试操作函数。 1)查看DataFrame数据及属性 2)使用DataFrame选择数据: 3)使用DataFrame重置数据: 4)使用Dat 阅读全文
posted @ 2018-07-06 07:25 夕阳下的无名草 阅读(7412) 评论(0) 推荐(0) 编辑
摘要: 一 列表 1 列表的循环遍历 结果 2. 使用while循环 3 列表添加元素("增"append, extend, insert) 1) append 通过append可以向列表添加元素 2) extend 通过extend可以将另一个集合中的元素逐一添加到列表中 3) insert insert 阅读全文
posted @ 2018-06-06 08:06 夕阳下的无名草 阅读(204) 评论(0) 推荐(0) 编辑
摘要: 1 变量的类型 (1) Numbers(数字) int long float complex(复数) (2) 布尔类型 True False (3) String 字符串 (4) List 列表 Tuple 元祖 Dictionary 字典 2 输出 结果是: 我今年10岁 我的姓名是xiaohua 阅读全文
posted @ 2018-06-04 23:23 夕阳下的无名草 阅读(214) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 10 下一页