《机器学习实践》程序清单2-2
将文本记录转换为NumPy的解析程序
def file2matrix(filename): print("读入文件" + str(filename)) #以下两行为打开文本文件并读取内容到数组,有没有发现这个操作好简单?! fr = open(filename) arrayOLines = fr.readlines() #把文件中的文本转为数组 numberOfLines = len(arrayOLines)#得到文件行数 returnMat = zeros((numberOfLines,3)) #创建返回的Numpy矩阵,1000行所有值均为0的 #print(returnMat) classLabelVector = [] index = 0 for line in arrayOLines: line = line.strip() listFromLine = line.split('\t') print(listFromLine) #访问矩阵中的元素的方法 #returnMat[1,0:3],3个数字依次表示第1行,从第0列开始,到第2列 #returnMat[1,0:],2个数字依次表示第1行,从第0列开始,到第最后一列 #returnMat[1,:],1个数字依次表示第1行,从第0列开始,到第最后一列,即全部列 #returnMat[2,:3],1个数字依次表示第2行,从第0列开始,到第2列 returnMat[index,0:] = listFromLine[0:3] classLabelVector.append(int(listFromLine[-1])) index += 1 #print(returnMat[1,0:4]) return returnMat,classLabelVector
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 软件产品开发中常见的10个问题及处理方法
· .NET 原生驾驭 AI 新基建实战系列:向量数据库的应用与畅想
· 从问题排查到源码分析:ActiveMQ消费端频繁日志刷屏的秘密
· 一次Java后端服务间歇性响应慢的问题排查记录
· dotnet 源代码生成器分析器入门
· ThreeJs-16智慧城市项目(重磅以及未来发展ai)
· 软件产品开发中常见的10个问题及处理方法
· Vite CVE-2025-30208 安全漏洞
· 互联网不景气了那就玩玩嵌入式吧,用纯.NET开发并制作一个智能桌面机器人(四):结合BotSharp
· MQ 如何保证数据一致性?