摘要: 因为论文关系要用到pyspark,具体情形如下: 有一个list=['aaa','bbb','ccc','ddd'],然后有一个rdd内数据类型是str,eg:'abcdefg',正常如果是需要筛选数组包含的rdd数据可以定义一个broadcast,然后写成: 我的需求是要筛选str中包含有list 阅读全文
posted @ 2019-03-31 16:38 loeklvlh 阅读(2126) 评论(0) 推荐(0) 编辑