2021年4月23日

随笔

摘要: # coding: utf-8import reimport gensimimport jiebafrom gensim import corpora, modelsdef get_chinese(text): """ :param text: :return: """ return "".join 阅读全文

posted @ 2021-04-23 14:52 nnnnnnnnnnnnnnnn 阅读(137) 评论(0) 推荐(0) 编辑

2021年4月13日

先验和后验

摘要: P(B|A)=P(A|B)*P(B)/(P(A|B)*P(B)+P(A|B)*P(^B)) 阅读全文

posted @ 2021-04-13 14:17 nnnnnnnnnnnnnnnn 阅读(71) 评论(0) 推荐(0) 编辑

2021年4月12日

共现矩阵比 glove

摘要: f((vi-vj)Tvk) = pik/pjk 对数 mae 逼近回归 svd ATA AAT 特征向量 S D AAT * 特征向量1 = x ATA的特征向量 V 阅读全文

posted @ 2021-04-12 23:15 nnnnnnnnnnnnnnnn 阅读(60) 评论(0) 推荐(0) 编辑

生成任务的解码

摘要: top-k sample 取top-k sample top-p 不需要设置k值,满足p后自动截取当前个数 beam-search 变向的贪婪策略 阅读全文

posted @ 2021-04-12 15:08 nnnnnnnnnnnnnnnn 阅读(51) 评论(0) 推荐(0) 编辑

pagerank

摘要: 状态转移矩阵A A*L = L 初始化为1 【 pagerank(A), pagerank(B), pagerank(C) 】 阅读全文

posted @ 2021-04-12 14:06 nnnnnnnnnnnnnnnn 阅读(107) 评论(0) 推荐(0) 编辑

2021年3月11日

准备1 xgb

摘要: 1.介绍gdbt:它是一种基于boosting增强策略的加法模型,每一次迭代学习一棵树来拟合前t-1颗树的预测结果和真实结果的残差。 2.介绍xgb:它对gdbt进行了一系列的优化,比如通过每一步拟合之前步的预测结果和真实结果的均方差,然后使用泰勒二阶展开、目标函数加上正则项、支持并行和缺失值,核心 阅读全文

posted @ 2021-03-11 17:12 nnnnnnnnnnnnnnnn 阅读(222) 评论(0) 推荐(0) 编辑

2020年12月1日

shuffle generator

摘要: import random import numpy as np mode = 0 x = np.arange(100)### 假设这个为featuresy = np.arange(100) ########## 假设这个为labels def shuffle_aligned_list(data): 阅读全文

posted @ 2020-12-01 15:06 nnnnnnnnnnnnnnnn 阅读(75) 评论(0) 推荐(0) 编辑

2020年11月23日

bert as service

摘要: 1.git 地址 https://github.com/hanxiao/bert-as-service 2.pip安装 pip install bert-serving-server # 服务端 pip install bert-serving-client # 客户端 3.启动 bert-serv 阅读全文

posted @ 2020-11-23 10:12 nnnnnnnnnnnnnnnn 阅读(153) 评论(0) 推荐(0) 编辑

2020年11月10日

python 打rpm包

摘要: step1.对接口进行打包 pyinstaller app.py tar czvf app.tar app.py tar包移动到SOURCES step2.安装rpmbuild 组件及生成相关目录 yum install rpmdevtools yum install -y rpm-build rp 阅读全文

posted @ 2020-11-10 21:19 nnnnnnnnnnnnnnnn 阅读(433) 评论(0) 推荐(0) 编辑

2020年8月3日

python 生成器和fire

摘要: class HyperParameters(object): """ 用于管理模型超参数 """ def __init__( self, max_length: int = 128, epochs=4, batch_size=32, learning_rate=2e-5, fp16=True, fp 阅读全文

posted @ 2020-08-03 13:07 nnnnnnnnnnnnnnnn 阅读(172) 评论(0) 推荐(0) 编辑

导航