摘要:
介绍 在参与的项目和产品中,涉及到模型和算法的需求,主要以自然语言处理(NLP)和知识图谱(KG)为主。NLP涉及面太广,而聚焦在具体场景下,想要生产落地的还需要花很多功夫。 作为NLP的主要方向,情感分析,文本多分类,实体识别等已经在项目中得到应用。例如 通过实体识别,抽取文本中提及到的公司、个人 阅读全文
摘要:
本文是对 "100天搞定机器学习|Day33 34 随机森林" 的补充 前文对随机森林的概念、工作原理、使用方法做了简单介绍,并提供了分类和回归的实例。 本期我们重点讲一下: 1、集成学习、Bagging和随机森林概念及相互关系 2、随机森林参数解释及设置建议 3、随机森林模型调参实战 4、随机森林 阅读全文
摘要:
1、熵的定义 熵最早是一个物理学概念,由克劳修斯于1854年提出,它是描述事物无序性的参数,跟热力学第二定律的宏观方向性有关:在不加外力的情况下,总是往混乱状态改变。熵增是宇宙的基本定律,自然的有序状态会自发的逐步变为混沌状态。 1948年,香农将熵的概念引申到信道通信的过程中,从而开创了”信息论“ 阅读全文
摘要:
目前计算机视觉(CV)与自然语言处理(NLP)及语音识别并列为人工智能三大热点方向,而计算机视觉中的对象检测(objectdetection)应用非常广泛,比如自动驾驶、视频监控、工业质检、医疗诊断等场景。 目标检测的根本任务就是将图片或者视频中感兴趣的目标提取出来,目标的识别可以基于颜色、纹理、形 阅读全文
摘要:
100天搞定机器学习 大家好,100天搞定机器学习前54天是对Avik Jain开源项目100 Days Of ML Code的翻译+自己的理解 https://github.com/Avik Jain/100 Days Of ML Code 但是这个项目到54天就鸽掉了,十分可惜。 从第55天开始 阅读全文
摘要:
前段时间在阿里云买了一台服务器,准备部署网站,近期想玩一些深度学习项目,正好拿来用。TensorFlow官网的安装仅提及Ubuntu,但我的ECS操作系统是 CentOS 7.6 64位,搭建Python、TensorFlow、Jupyter开发环境过程中遇到很多问题。这里将具体步骤分享给大家,可以 阅读全文
摘要:
"几张GIF理解K 均值聚类原理" "k均值聚类数学推导与python实现" 前文说了k均值聚类,他是基于中心的聚类方法,通过迭代将样本分到k个类中,使每个样本与其所属类的中心或均值最近。 今天我们看一下无监督学习之聚类方法的另一种算法,层次聚类: 层次聚类前提假设类别直接存在层次关系,通过计算不同 阅读全文
摘要:
送你一把百度云盘万能钥匙,不用提取码也能开启下载 同学们知道,我们在百度网盘分享文件的时候,一般都会设置一个提取码,以保障传播范围及私密性,只有输入提取码才能下载分享的资料。很多同学在云盘搜等网站找百度网盘学习资料时,经常会遇到只有云链接,但是没有提取码的尴尬。 这里向大家推荐一款神器——百度云盘万 阅读全文