11 2022 档案
摘要:
本文详细介绍 GECToR 这一优秀的文本纠错模型,使用 Transformer 编码器的序列标注器,以保证文本数据的质量,进而提升NLP模型的效果。
阅读全文

摘要:
随着Diffusion Model的普及,AI绘画只需要你输入文本描述,模型就能在几分钟内生成精准匹配的精美图像。本文从使用步骤、费用和商用等角度对3个主流平台进行比较:DALL·E2、Midjourney、Stable Diffusion。
阅读全文

摘要:
大量的数据科学职位需要精通 SQL,它也是数据分析师、数据科学家、数据建模岗最常考核的面试技能。在本篇内容中 ShowMeAI 将梳理汇总所有面试 SQL 问题,按照不同的主题构建练习专项块。
阅读全文

摘要:
本文系统介绍了『单变量异常检测』和『多变量异常检测』识别技术,包括传统的统计方法(四分位距、标准差),以及前沿的机器学习模型(孤立森林、DBSCAN、LOF局部离群因子)。
阅读全文

摘要:
本文介绍了7个超实用的Jupyter Notebook扩展插件,帮助你加速开发与应用:Voilà、nbdime、RISE、Bokeh、nbgrader、Jupytext、jupyterlab-git。
阅读全文

摘要:
本文讲解如何使用whylogs工具库,构建详细的AI日志平台,并监控机器学习模型的流程与效果。核心操作包括:环境配置、新建项目并获取ID、获取组织ID和访问Key、将配置文件写入WhyLabs、监控模型性能指标。
阅读全文

摘要:
本文讲解Pandas工具库几个核心函数,能高效处理时间序列:resample、shift、rolling。帮你得心应手处理时间序列数据!
阅读全文

摘要:
本文使用『城市酒店和度假酒店的预订信息』,对旅游业的发展现状进行数据分析,包含了完整的数据分析流程:数据读取、数据初览、数据预处理、描述性统计、探索性数据分析、关联分析、相关性分析。
阅读全文

摘要:
机器学习算法理论比较枯燥乏味,但有许多有趣且有用的网站,您可以像游戏一样交互式操作,并同时学习机器学习概念、模型和应用知识。以下是 ShowMeAI 为大家整理的18个交互式机器学习网站,学起来!
阅读全文

摘要:
本文讲解9种『炫酷高级』的数据图表,可视化地表示比例或百分比:哑铃图、甜甜圈图、华夫饼图、堆积条形图...附上代码,快快用起来吧!
阅读全文

摘要:
Pandas灵活强大,是数据分析必备工具库!但处理大型数据集时,需过渡到PySpark才可以发挥并行计算的优势。本文总结了Pandas与PySpark的核心功能代码段,掌握即可丝滑切换。
阅读全文

摘要:
本文讲解一种比较全能的『机器学习模型可解释性』方法——SHAP。通过调用Python的SHAP工具库,对机器学习模型做可解释性分析,判断不同特征对于当前模型的重要程度。
阅读全文

摘要:
数据集中的异常值,对于数据分布、建模等都有影响。本文讲解两大类异常值的检测方法及其Python实现:可视化方法(箱线图&直方图)、统计方法(z分数&四分位距)。
阅读全文

摘要:
本文讲解使用Panel、hvPlot等工具库,简单快速地制作可交互的数据仪表板,对180万起野火数据进行空间可视化,更直观地对起火原因、火势大小、持续时长进行单维或多维分析。
阅读全文

摘要:
客户分群(客户细分)对于绘制用户画像、构建个性化推广、产品和服务策略,都非常重要。本文讲解此过程中,多种机器学习聚类算法的建模流程与评估模式。
阅读全文

摘要:
本文以保险金额预估为例,讲解机器学习从开发到云端服务部署的全流程:基于PyCaret开发机器学习全流程、基于Flask搭建简易前端Web应用程序、在Heroku云上部署机器学习应用。
阅读全文

摘要:
借助AI进行邮件正文与附件内容的识别,可以极大提高工作效率。本文讲解如何设计一个AI系统,完成邮件内容意图检测:架构初揽、邮件正文&附件的理解与处理、搭建多数据源混合网络、训练&评估。
阅读全文

摘要:
数据随着时间变化,会导致已有模型的准确度大打折扣,这就是数据漂移问题。本文讲解数据漂移问题的诸多实际案例、检测方法、基于evidently库的代码实现。
阅读全文

摘要:
如何预测客户价值,计算特定时间段内能带来的价值,是互联网公司在面临海量用户时急需解决的运营命题。本文就来讲解『机器学习+RFM模型』的精细化运营解决方案。
阅读全文

摘要:
『人工智能+新药研发』已经成为国内外医药企业的发展新模式!本文讲解 AI 在新药研发领域的诸多应用方向与 MolSearch 工具库的应用实践——药物晶型预测、靶点选择、患者招募、虚拟药物筛选、AI新药研发辅助系统。
阅读全文

摘要:
特征工程一般是手动完成,不仅依赖于工程师的丰富经验,也非常耗时。因此『自动化特征工程』可以自动生成大量候选特征,帮助数据科学家显著提升了工作效率和模型效果。
阅读全文

摘要:
股票价格数据是一个时间序列形态的数据。所以,我们使用『循环神经网络(RNN)』对这种时序相关的数据进行建模,并将其应用在股票数据上进行预测。
阅读全文

摘要:
课程结合了最新的研究进展,讲解深度强化学习领域的前沿知识和实践,覆盖了使用深度学习神经网络进行强化学习的各类方法模型。
阅读全文

摘要:
研究生级课程,围绕无监督学习的场景展开,包括深度生成模型和自监督学习两大主题,涵盖了许多当前的最新研究和模型。
阅读全文

摘要:
课程以实战为主,讲解了不同场景下应用深度学习解决问题的工具、过程和方法:从问题理解,方法选择、数据管理、选择 GPU 到 Web 部署、监控和再训练。
阅读全文

摘要:
课程以深度学习的典型方法、模型设计、可视化与模型理解为主题,讲解了自然语言处理、计算机视觉、强化学习等领域的AI模型全域知识。
阅读全文

摘要:
机器学习和深度学习等人工智能技术在森林火灾扑救过程中的应用。
阅读全文

摘要:
一门使用深度学习解决NLP问题的高质量课程,覆盖字词句等文本编码方法、循环神经网络、卷积神经网络、transformer自注意力与BERT、自然语言处理预训练模型等知识。
阅读全文

摘要:
吴恩达与助教在斯坦福开设的深度学习课程,内容覆盖基础知识、各类神经网络、实际应用等排,是很多人的深度学习入门课。
阅读全文

摘要:
吴恩达与其他几位斯坦福教授主讲,对机器学习和统计模式识别提供了广泛介绍,是机器学习领域里门非常重要的高质量课程,也是许多人进入AI领域的基石。
阅读全文

摘要:
客户分群对于精准营销的意义重大,而机器学习可以优化这一过程。本文会详细拆解实现过程:数据收集、创建RFM表、探索数据&数据变换、应用聚类做用户分群、解释结果。
阅读全文

摘要:
斯坦福明星课程,计算机视觉方向的必学经典。课程为期10周,学生将搭建和训练自己的神经网络,并了解计算机视觉领域的研究进展。
阅读全文

摘要:
吴恩达十年前首次推出的课程,收获了480万学习者。2022年课程团队对其进更新升级,广泛地介绍了现代机器学习,包括监督学习、无监督学习、以及硅谷AI创新最佳实践。
阅读全文

摘要:
深度学习入门首选!课程可以帮助学习者掌握知识和技能,并邀请工业界与学术界的深度学习专家为大家提供职业发展建议,提供一条迈向 AI 世界的清晰途径。
阅读全文

摘要:
本文使用 GAN(生成对抗网络)进行AI绘画。torchgan是基于PyTorch的一个GAN工具库,本文讲解搭建DCGAN神经网络,并应用于『莫奈』风格绘画的全过程。
阅读全文

摘要:
本文讲解如何使用Python的schedule库完成自动化调度程序,通过代『发送邮件』这一代码实例展示了构建任务与任务调度的全过程。
阅读全文

摘要:
面向几何与AI交叉专业课程,围绕几何学垂直领域,介绍几何学基本概念、技术与深度学习的关联应用知识与方法。
阅读全文

摘要:
进阶课程,覆盖深度学习与CV更深入的研究方向:神经网络可解释性、相似度与度量学习、自注意力与transformer、图神经网络、生成模型与GAN等。
阅读全文

摘要:
台大李宏毅老师的机器学习,是国语授课中最受欢迎的AI课程之一。课程内容具备很好的前沿度,覆盖了机器学习与深度学习基础知识与研究界关心的新进展。
阅读全文

摘要:
课程标题虽为【深度神经网络应用】,但实际内容覆盖多个领域:Python、Pandas、特征工程、深度学习、NLP、CV、强化学习、时间序列、安全和数据生成等。
阅读全文

摘要:
课程深入探讨了基于神经网络的计算机视觉应用的细节,包括深度学习算法、神经网络体系结构、用于视觉识别任务的训练和微调网络的实用工程技巧等。
阅读全文

摘要:
课程将人工神经网络与统计学概念相关联,在数学&概念层面上解释深度学习与生成模型,并强调深度学习的实践,对于构建深度学习技能有很大帮助。
阅读全文

摘要:
NLP进阶课程,详解前沿技术点与典型应用。课程重点是【神经语言模型】和【迁移学习】,这二者都极大推动了最先进技术的发展。
阅读全文

摘要:
目前最新的数据结构算法课程,Dave Mount教授以手绘的方式,拆解各种复杂数据结构与算法思路。课程可以支撑学习者全面掌握数据结构、破解LeetCode。
阅读全文

摘要:
全网目前知识点覆盖最全的深度学习课程之一,主要面向研究生,讲解从深度学习诞生至今的各领域典型模型,让学生熟悉行业最先进的深度学习技术。
阅读全文

摘要:
Altair是Python统计可视化库,提供了强大而简洁的可视化语法,可以产出漂亮的数据分析可视化结果,并支持交互式操作和勾选局部数据深入分析。本文以实例讲解Altair的数据分析过程,以及交互文档报告的生成。...
阅读全文

摘要:
AI诸多工具库工具库之间的切换,是一件耗时耗力的麻烦事。ONNX 即应运而生,使不同人工智能框架(如PyTorch、TensorRT、MXNet)可以采用相同格式存储模型数据并交互,极大方便了算法及模型在不同的框架之间的迁移,带来了AI生态的自由流通。...
阅读全文

摘要:
油管爆火的数学课程!Trefor Bazett授课风格活泼,并对视频画面做了大量可视化处理,将核心数学要点讲解得生动有趣。必学清单+1,漏补缺知识手册+1!
阅读全文

摘要:
油管爆火的数学课程!Trefor Bazett授课风格活泼,并对视频画面做了大量可视化处理,将核心数学要点讲解得生动有趣。必学清单+1,漏补缺知识手册+1!
阅读全文

摘要:
油管爆火的数学课程!Trefor Bazett授课风格活泼,并对视频画面做了大量可视化处理,将核心数学要点讲解得生动有趣。必学清单+1,漏补缺知识手册+1!
阅读全文

摘要:
创造性地将【计算机科学+数学+应用】3个领域的内容融合进这门交互式编程课,并依托Julia编程语言为实践依托,讲解基础知识与建模方法。
阅读全文

摘要:
神经网络在学习能力与性能方面,远超传统机器学习算法,其大量层与数十亿参数的网络可以轻松学习数据的模式与规律,也容易陷入了『过拟合』问题。本篇梳理4类缓解过拟合的方法:数据增强、Dropout随机失活、L1和L2正则化、Early Stopping/早停止。
阅读全文
