02 2024 档案

摘要:搜索引擎对互联网的重要性不言而喻,不过,随着ChatGPT及其类似AI工具的推出,对搜索引擎带来了前所未有的挑战。 因为ChatGPT具有自然语言处理能力,能够更好地理解用户的搜索意图,提供更准确、更相关的搜索结果。同时,还可以根据用户的搜索历史和行为数据,为用户提供更加个性化的搜索体验,推荐更符合 阅读全文
posted @ 2024-02-19 16:22 wang_yb 阅读(1144) 评论(0) 推荐(7) 编辑
摘要:gRPC是一个高性能、开源、通用的远程过程调用(RPC)框架,由Google推出。它基于HTTP/2协议标准设计开发,默认采用Protocol Buffers数据序列化协议,支持多种开发语言。 在gRPC中,客户端可以像调用本地对象一样直接调用另一台不同的机器上服务端应用的方法,使得您能够更容易地创 阅读全文
posted @ 2024-02-18 18:44 wang_yb 阅读(328) 评论(0) 推荐(2) 编辑
摘要:pandas的DataFrame功能强大自不必说,它可以帮助我们极大的提高统计分析的效率。 不过,使用DataFrame开发我们的分析程序的时候,经常需要打印出DataFrame的内容,以验证和调试数据的处理是否正确。 在命令行中虽然可以直接打印出DataFrame的内容,但是阅读比较困难。正好前段 阅读全文
posted @ 2024-02-13 19:04 wang_yb 阅读(665) 评论(0) 推荐(2) 编辑
摘要:Rich库的功能就像它的名字一样,使Python编程更加丰富(rich),它帮助开发者在控制台(命令行)输出中创建丰富、多彩和具有格式化的文本。 本篇总结了如何使用Rich库让我们的命令行工具更加美观。 1. 安装 通过pip安装: pip install rich 使用下面的命令验证是否安装成功。 阅读全文
posted @ 2024-02-12 16:54 wang_yb 阅读(2136) 评论(0) 推荐(1) 编辑
摘要:模型持久化(模型保存与加载)是机器学习完成的最后一步。因为,在实际情况中,训练一个模型可能会非常耗时,如果每次需要使用模型时都要重新训练,这无疑会浪费大量的计算资源和时间。 通过将训练好的模型持久化到磁盘,我们可以在需要使用模型时直接从磁盘加载到内存,而无需重新训练。这样不仅可以节省时间,还可以提高 阅读全文
posted @ 2024-02-08 15:48 wang_yb 阅读(360) 评论(0) 推荐(1) 编辑
摘要:之前介绍过Python的Fire库,一个用来生成命令行工具的的库。请参考:Python Fire:自动生成命令行接口 今天,针对命令行参数,补充两种更加灵活的设置方式。 1. *args 型参数 *args型的参数可以接受任意长度的参数。比如,模拟一个学校发送通知的功能: import fire d 阅读全文
posted @ 2024-02-05 14:17 wang_yb 阅读(354) 评论(0) 推荐(2) 编辑
摘要:分类模型评估时,scikit-learn提供了混淆矩阵和分类报告是两个非常实用且常用的工具。它们为我们提供了详细的信息,帮助我们了解模型的优缺点,从而进一步优化模型。 这两个工具之所以单独出来介绍,是因为它们的输出内容特别适合用在模型的评估报告中。 1. 混淆矩阵 混淆矩阵(Confusion Ma 阅读全文
posted @ 2024-02-04 09:33 wang_yb 阅读(404) 评论(0) 推荐(0) 编辑
摘要:命令行程序是平时写一些小工具时最常用的方式。 为了让命令行程序更加灵活,我们常常会设置一些参数,根据参数让程序执行不同的功能。这样就不用频繁的修改代码来执行不同的功能。 随着命令行程序功能的丰富,也就是参数多了以后,解析和管理参数之间的关系会变得越来越繁重。而本次介绍的 Fire 库,正好可以解决这 阅读全文
posted @ 2024-02-01 10:15 wang_yb 阅读(501) 评论(0) 推荐(1) 编辑