06 2020 档案

摘要:Extracting keywords from texts has become a challenge for individuals and organizations as the information grows in complexity and size. The need to a 阅读全文
posted @ 2020-06-30 19:45 今夜无风 阅读(923) 评论(0) 推荐(0) 编辑
摘要:def count_factors(): n = int(input('input the num:')) num = n res = [] while n > 1: for i in range(2, n+1): if n % i == 0: n = int(n/i) res.append(i) 阅读全文
posted @ 2020-06-28 19:43 今夜无风 阅读(2059) 评论(0) 推荐(0) 编辑
摘要:资料来源:https://www.cnblogs.com/Luv-GEM/p/10884493.html TextRank算法源自于PageRank算法。PageRank算法最初是作为互联网网页排序的方法,经过轻微地改动,可以被应用于文本摘要领域。 本文分为两部分,第一部分介绍TextRank做文本 阅读全文
posted @ 2020-06-28 11:13 今夜无风 阅读(956) 评论(0) 推荐(0) 编辑
摘要:(1)为什么残差学习的效果会如此的好?与其他论文相比,深度残差学习具有更深的网络结构,此外,残差学习也是网络变深的原因?为什么网络深度如此的重要? 解:一般认为神经网络的每一层分别对应于提取不同层次的特征信息,有低层,中层和高层,而网络越深的时候,提取到的不同层次的信息会越多,而不同层次间的层次信息 阅读全文
posted @ 2020-06-22 20:38 今夜无风 阅读(207) 评论(0) 推荐(0) 编辑
摘要:(1)Gaussian 满足mean=0,std=1的高斯分布x∼N(mean,std2) (2)Xavier 满足x∼U(−a,+a)x∼U(−a,+a)的均匀分布, 其中 a = sqrt(3/n) (3)MSRA 满足x∼N(0,σ2)x∼N(0,σ2)的高斯分布,其中σ = sqrt(2/n 阅读全文
posted @ 2020-06-22 20:35 今夜无风 阅读(768) 评论(0) 推荐(0) 编辑
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- # author:ShidongDu time:2020/6/3 import time import pandas as pd import re # 结点类 class node: def __init_ 阅读全文
posted @ 2020-06-11 14:46 今夜无风 阅读(282) 评论(0) 推荐(0) 编辑
摘要:ner(命名实体识别)一般是词典和模型方式结合,词典负责已有词识别,模型负责未知词识别。 在不需发现未知词的情况下基于词典的实体识别已足够 基于字典的ner也有两种做法:字符串多模匹配 和 切词(词典加入自定义词库) 字符串多模匹配多模匹配有两种基本算法:trie树 和 记录长度集合的最长匹配 tr 阅读全文
posted @ 2020-06-11 14:37 今夜无风 阅读(2977) 评论(0) 推荐(1) 编辑
摘要:python 实现 def edit_distance(word1, word2): len1 = len(word1) len2 = len(word2) dp = np.zeros((len1 + 1,len2 + 1)) for i in range(len1 + 1): dp[i][0] = 阅读全文
posted @ 2020-06-10 15:22 今夜无风 阅读(243) 评论(0) 推荐(0) 编辑
摘要:点互信息算法(PMI) 基本思想:是统计两个词语在文本中同时出现的概率,如果概率越大,其相关性就越紧密,关联度越高。 PMI > 0;两个词语是相关的;值越大,相关性越强。 PMI = 0;两个词语是统计独立的,不相关也不互斥。 PMI < 0;两个词语是不相关的,互斥的。 从概率思想理解: 如果两 阅读全文
posted @ 2020-06-10 14:58 今夜无风 阅读(1956) 评论(0) 推荐(0) 编辑