上一页 1 2 3 4 5 6 ··· 18 下一页

2022年5月6日

python time 时间模块最常见的用法

摘要: import time # 获取结构化时间 print(time.localtime()) #time.struct_time(tm_year=2022, tm_mon=5, tm_mday=6, tm_hour=11, tm_min=34, tm_sec=35, tm_wday=4, tm_yda 阅读全文

posted @ 2022-05-06 11:51 paike123 阅读(62) 评论(0) 推荐(0) 编辑

2022年5月2日

Word2Vec 简介

摘要: word2Vec 能做什么: 计算相似度: 寻找相似词 或者 相似文章的相似度 文本生成,机器编译等 定义: word2Vec 是谷歌2013年提出来的NLP工具,它的特点就是可以将单词转化为向量表示,这样就可以通过向量与向量之间的距离来度量它们之间的相似度,从而发现他们之间存在的潜在关系。 虽然现 阅读全文

posted @ 2022-05-02 11:08 paike123 阅读(657) 评论(0) 推荐(0) 编辑

2022年4月27日

js 判断一个元素是否在数组中

摘要: (1).let arr = [1,2,3]; arr.includes(1) // true arr.includes(5) //false (2).a=["1", "3", "2", "3", "0"]; console.log(a.indexOf ('3'));//1 console.log(a 阅读全文

posted @ 2022-04-27 10:16 paike123 阅读(43) 评论(0) 推荐(0) 编辑

2022年4月18日

js删除数组中空值的方法

摘要: 使用 filter 过滤方法来过滤 null,undefined,''等值 js可以删除数组中的空值有多种方法,下面就来说几种自己常用的,大家参考一下。 JS示例代码:trim()为字符串方法 var arr = ['A', '', 'B', null, undefined, 'C', ' ','D 阅读全文

posted @ 2022-04-18 17:05 paike123 阅读(2198) 评论(0) 推荐(0) 编辑

2022年3月9日

jieba分词库——基于 TextRank 算法的关键词抽取

摘要: 基于 TextRank 算法的关键词抽取 TextRank算法 TD-IDF是基于词频的算法,而TextRank是基于图 形的算法。 TextRank是受到PageRank算法的启发。 PageRank算法 PageRank主要用于对在线搜索结果中的网页进行排序。 PageRank对于每个网页页面都 阅读全文

posted @ 2022-03-09 15:06 paike123 阅读(743) 评论(0) 推荐(0) 编辑

2022年3月1日

python sort 函数和sorted 的区别

摘要: 一、sort函数 如果对python中的列表进行排序,可以使用List类的成员函数sort,该函数会在原空间上进行操作,对列表本身进行修改,不返回副本。语法如下: L.sort(cmp=None, key=None, reverse=False) 二、sorted函数 sorted函数就比sort函 阅读全文

posted @ 2022-03-01 15:39 paike123 阅读(144) 评论(0) 推荐(0) 编辑

2022年2月28日

文章画像得计算

摘要: 一: 计算TF-IDF 值 1: 初始化spark环境 # 初始化spark信息 import os import sys BASE_DIR= os.path.dirname(os.path.dirname("/bigdata/projects/toutiao_projects/reco_sys/o 阅读全文

posted @ 2022-02-28 17:37 paike123 阅读(57) 评论(0) 推荐(0) 编辑

2022年2月25日

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. Cannot validate serde: org.apache.hive.hcatalog.data.JsonSerDe

摘要: 用下列sql语句在hive 中创建表, create table user_action( actionTime STRING comment "user actions time", readTime STRING comment "user reading time", channelId IN 阅读全文

posted @ 2022-02-25 16:10 paike123 阅读(369) 评论(0) 推荐(0) 编辑

2022年2月21日

pyspark.sql.utils.AnalysisException: u"Table or view not found:`ods_fpos`.`sales_order_item_promotion`

摘要: 解决 pyspark.sql.utils.AnalysisException: u"Table or view not found:`ods_fpos`.`sales_order_item_promotion` 第一步:启动 hive的metastore元数据服务 hive --service me 阅读全文

posted @ 2022-02-21 15:26 paike123 阅读(649) 评论(0) 推荐(0) 编辑

2022年2月17日

flume

摘要: 一、Flume安装部署 1.1、安装地址 1) Flume 官网地址 http://flume.apache.org/ 2)文档查看地址 http://flume.apache.org/FlumeUserGuide.html 3)下载地址 http://archive.apache.org/dist 阅读全文

posted @ 2022-02-17 11:06 paike123 阅读(34) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 ··· 18 下一页

导航