摘要: 一、模型验证与性能评估 模型验证方法:确保评估的信服力 方法一:留出法 定义:将数据集一次性划分为训练集、验证集和测试集。强调测试集必须与训练集完全隔离,且只能用于最终评估,不饿能用于其他阶段 留出法数据集划分标准:70/15/15 案例:假设原始数据集D包含4369条商品评论,我们将分两步进行划分 阅读全文
posted @ 2026-03-25 13:06 sunshine_coast 阅读(1) 评论(0) 推荐(0)
摘要: 1.背景 承接文章:AI-使用DeepEval评测自己构建的RAG系统(二),从运行的评测结果来看,存在如下需要优化点: - 1.检索上下文为空 : actual_output 显示"上下文中没有提供关于'大语言模型LLM是什么,有什么特点'的任何信息。"- 2.Contextual Relevan 阅读全文
posted @ 2026-03-25 09:33 sunshine_coast 阅读(2) 评论(0) 推荐(0)
摘要: 基于AI-使用DeepEval评测自己构建的RAG系统(一) 的基础上,让AI帮忙分析了存在的问题和需要优化改进点,按照问题优先级列出,先重点关注高优先级的,清单如下: 一、高优先级问题 1. 安全性问题 - API密钥硬编码 :现在通过环境变量或配置文件获取API密钥,避免了硬编码的安全风险。 A 阅读全文
posted @ 2026-03-24 11:05 sunshine_coast 阅读(6) 评论(0) 推荐(0)
摘要: 1.使用tensorflow加载数据,并进行数据的预处理 import tensorflow as tf from sklearn.model_selection import train_test_split import numpy as np # 1. 加载数据(TF 2.x 方式) (x_t 阅读全文
posted @ 2026-03-20 16:18 sunshine_coast 阅读(5) 评论(0) 推荐(0)
摘要: tensorflow简介 是由 Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型。 核心概念: 张量(Tensor): 多维数组,是 TensorFlow 中的基本数据单位 计算图(Computation 阅读全文
posted @ 2026-03-19 16:06 sunshine_coast 阅读(3) 评论(0) 推荐(0)
摘要: 一、先理解RAG和DeepEval的底层逻辑 1.DeepEval是一个LLM评估框架,类似于"AI版的Pytest",专门用于测试和评估LLM应用的输出质量。它支持评估AI回答的准确性、幻觉程度、相关性等指标。 项目地址:https://deepeval.com/docs/getting-star 阅读全文
posted @ 2026-03-12 10:47 sunshine_coast 阅读(45) 评论(0) 推荐(0)
摘要: 一、闭包基础概念 1.1 什么是闭包? 闭包是指内部函数引用了外部函数的变量,并且外部函数返回内部函数的一种编程结构。 # 1.1.1 最简单的闭包 def outer_function(msg): """外部函数""" message = msg # 外部函数的变量 def inner_funct 阅读全文
posted @ 2026-03-09 18:24 sunshine_coast 阅读(1) 评论(0) 推荐(0)
摘要: 1.使用tensorflow加载数据,并进行数据的预处理 import tensorflow as tf #使用keras加载数据集,每个图像都表示为28*28的数字,而不是尺寸784的一维数组 fashion_mnist = tf.keras.datasets.fashion_mnist.load 阅读全文
posted @ 2026-03-08 18:32 sunshine_coast 阅读(36) 评论(0) 推荐(0)
摘要: 本文演示如何使用逻辑回归对鸢尾花数据集进行分类: 注:使用scikit-learn的逻辑回归 1.数据下载 # 导入必要的库 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.dat 阅读全文
posted @ 2026-03-06 13:25 sunshine_coast 阅读(2) 评论(0) 推荐(0)
摘要: 我们使用的mnist数据集,这是一组由高中生和美国人口普查局的员工手写的70000个数字图像。这个集合已经被研究如此之多,以此通常被称为机器学习的“hello world”。7万张图片,每个图片有784个特征,因为每个图像都是28×28像素,每个特征只代表一个像素的强弱,从0到255。 一. 训练二 阅读全文
posted @ 2026-03-05 18:28 sunshine_coast 阅读(5) 评论(0) 推荐(0)