摘要:
如题,基本环境和版本信息如下 ubuntu==22.04 tensorflow==2.6.0 bert4keras==0.11.4 python==3.9.13 在使用中,需要指定TensorFlow为2.0,即Keras使用tf.keras import os os.environ['TF_KER 阅读全文
摘要:
在神经网络训练中,好的权重 初始化会加速训练过程。 下面说一下kernel_initializer 权重初始化的方法。 不同的层可能使用不同的关键字来传递初始化方法,一般来说指定初始化方法的关键字是kernel_initializer 和 bias_initializer model.add(Den 阅读全文
摘要:
1、指定某个显卡 可以在文件开头加入如下代码: import os os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID" os.environ["CUDA_VISIBLE_DEVICES"] = "1, 2" # 使用第二,三块GPU(从0开始) 禁用GPU 阅读全文
摘要:
在上一篇中,我们新建了一个rasa项目,接下来需要准备nlu训练数据,一般存在一个yaml格式文件里,默认为nlu.yml。当然用户可以自己指定,如果自定义训练的时候得指定训练数据的位置,不然rasa train的时候会默认去data文件文件夹下查找nlu.yml。 rasa的训练数据一般有四种参数 阅读全文
摘要:
一、安装 可按照rasa官网installation操作,很简单,新建一个虚拟环境,然后安装rasa库 python3 -m venv ./venv source ./venv/bin/activate pip3 install -U pip pip3 install rasa 二、新建rasa项目 阅读全文
摘要:
因为很久没关机,中间操作了啥自己也忘了,电脑重启之后发现启动不了,一直是黑屏且光标不断闪烁。网上查找了各种方法尝试都无法解决,后来看到有一个说法让选择老内核试试,果然,在进入grub引导页面后,选择第一项Ubuntu的高级选项,进去之后可以看到有多个内核,默认是按第一个内核启动的,我选择了第二个内核 阅读全文
摘要:
上一篇文章中,我们讲述了如何用查词典的方法对中文语句分词,但这种方式不能百分百地解决中文分词问题,比如对于未登录词(在已有的词典中,或者训练语料里面没有出现过的词),无法用查词典的方式来切分,这时候可以用隐马尔可夫模型(HMM)来实现。在实际应用中,一般也是将词典匹配分词作为初分手段,再利用其他方法 阅读全文
摘要:
在英文中,单词之间有空格做天然的分割,分词变得非常简单。但是在中文中就没有那么容易了,所以分词是自然语言处理的基础,分词不好,后面很难去做进一步分析。尽管现在NLP中有很多算法以字来切分,比如bert,中文分词仍然是NLP中很重要、很基础的一块工作。目前已经有许多开源的中文分词工具,比如jieba, 阅读全文
摘要:
前言 今天在看一个算法的代码中,出现了tf.einsum()这个函数,之前没见过,所以查了下,居然是一块自己缺失的知识——爱因斯坦求和约定,赶紧恶补一下。知乎上有一个提问说——爱因斯坦求和约定除了增加歧义有任何好处吗,看来有些人对这个用法有不少疑惑,问题答案中很多答主们都在为有这么一个方便的标记法而 阅读全文
摘要:
一、背景 jupyter notebook默认是没有主题可选择的,有的系统安装后默认配置使用起来不太舒服,比如默认字体对代码阅读不友好,或者喜欢给代码加行号的也不知道该去哪里设置。本篇想介绍一下jupyter notebook的优化。 二、stylus管理器 stylus是一个网页插件,可对所有网页 阅读全文