Mr·Li程序员 - 博客园

2023年9月13日

摘要：最近做了几个模型，需要配置接口提供使用，这时候就用到了日志系统首先创建一个 logs.py 文件,在文件中配置日志等级、保存路径、日志文件大小、日志输出格式 import os import logging from logging.handlers import RotatingFileHand 阅读全文

posted @ 2023-09-13 14:38 Mr·Li程序员阅读(605) 评论(0) 推荐(0)

2023年2月13日

pandas的常用功能（时常更新）

摘要：

经常需要对数据进行清洗，所以总结一些好用的命令 1、将参数转变为数字型数据（例如：字符串形式的‘123’，转变成数字型的123） pd.to_numeric(data,errors='ignore')errors有三个值：raise--无效解析引发异常（默认）corece--将无效解析设置为NANi 阅读全文

posted @ 2023-02-13 10:13 Mr·Li程序员阅读(99) 评论(3) 推荐(0)

2022年8月5日

linux安装miniconda以及英伟达显卡驱动

摘要：

最近工作重心放在了服务器的环境上，来记录一下这几天安装环境的步骤，由于之前对这块知识很少，所以被整的很头疼，不过最后环境安装成功了，模型也可以运行起来一、miniconda 1、安装miniconda 首先在root/下创建一个文件，里面放各种安装包以及插件 #网上下载对应miniconda版本w 阅读全文

posted @ 2022-08-05 10:12 Mr·Li程序员阅读(465) 评论(0) 推荐(0)

2022年3月15日

机器学习模型进行predict预测时，预测全为1

摘要：

最近在维护xgboost二分类算子，经过现场客户反馈的问题，模型在评估推理的时候，结果很不理想，实际测试确实模型预测全为1 一开始以为是数据不均匀导致的预测效果差，也尝试了分布均衡的数据以及网格搜索模型参数调参，结果还是同样的效果，问题没出现在这里接着经过debug后，发现模型在fit的时候，特阅读全文

posted @ 2022-03-15 17:18 Mr·Li程序员阅读(2175) 评论(0) 推荐(0)

2022年1月27日

ValueError: feature_names mismatch:

摘要：

最近测试平台算子，发现xgb算子出现bug：feature_names mismatch ValueError: feature_names mismatch: ['a1', 'a2', 'a3', 'a4'] ['f0', 'f1', 'f2', 'f3'] expected a1, a3, a2 阅读全文

posted @ 2022-01-27 10:53 Mr·Li程序员阅读(501) 评论(0) 推荐(0)

2022年1月19日

ValueError: Error when checking target: expected activation_6 to have shape (2,) but got array with shape (1,)

摘要：

小叙：最近测试图像分类算子，发现出现了上述的错误，一开始以为数据格式出现了问题，比如图片通道不同导致的等等，到最后定位到了代码数据处理上原因：keras激活层需要维度为2，但是只有一列内容是因为这个算子在图像标签做独热编码处理的时候，直接调用第三方库LabelBinarizer，而二分类的标签经阅读全文

posted @ 2022-01-19 14:46 Mr·Li程序员阅读(498) 评论(0) 推荐(0)

2021年12月29日

在pycharm上配置pyspark

摘要：

1、下载完spark，解压，我下载的是spark-2.4.1版本，在文件的 \spark-2.4.1-bin-hadoop2.7\python\lib 中有两个文件这两个文件之后会用到 2、由于使用了pyspark时from pyspark import SparkContext，需要下载py4j 阅读全文

posted @ 2021-12-29 09:51 Mr·Li程序员阅读(1607) 评论(0) 推荐(0)

2021年12月28日

配置ssh密钥并与代码库相关联

摘要：

首先需要下载一个git插件 https://git-scm.com/downloads 第1步：创建SSH Key 打开Git Bash，在控制台中输入以下命令: $ ssh-keygen -t rsa -C "youremail@example.com" 密钥类型可以用 -t 选项指定。如果没有指阅读全文

posted @ 2021-12-28 17:04 Mr·Li程序员阅读(125) 评论(0) 推荐(0)

2021年11月25日

pip和conda生成requirements.txt

摘要：

#将项目中的所有安装包详细输出 pip freeze>requirements.txt #安装requirements.txt中的包 pip install -r requirements.txt conda 批量导出包含环境中所有组件的requirements.txt文件 conda list - 阅读全文

posted @ 2021-11-25 09:59 Mr·Li程序员阅读(978) 评论(0) 推荐(0)

2021年11月16日

IDEA本地配置kerberos认证

摘要：

1、项目导入之后设置maven依赖之后先将scala代码文件设为source 2、创建resources文件夹，将配置的资源文件放入这里 3、设置在本地运行代码：-Dspark.master=local，并设置其他参数 4、在跑模型之前先读取资源文件中的配置信息进行kerberos认证 def in 阅读全文

posted @ 2021-11-16 15:38 Mr·Li程序员阅读(963) 评论(0) 推荐(1)

公告