《机器学习实践》程序清单2-2

将文本记录转换为NumPy的解析程序

复制代码
def file2matrix(filename):
    print("读入文件" + str(filename))

    #以下两行为打开文本文件并读取内容到数组,有没有发现这个操作好简单?!
    fr = open(filename)
    arrayOLines = fr.readlines() #把文件中的文本转为数组

    numberOfLines = len(arrayOLines)#得到文件行数
    returnMat = zeros((numberOfLines,3)) #创建返回的Numpy矩阵,1000行所有值均为0的
    #print(returnMat)
    classLabelVector = []
    index = 0
    for line in arrayOLines:
        line = line.strip()
        listFromLine = line.split('\t') 
        print(listFromLine)

        #访问矩阵中的元素的方法
        #returnMat[1,0:3],3个数字依次表示第1行,从第0列开始,到第2列
        #returnMat[1,0:],2个数字依次表示第1行,从第0列开始,到第最后一列
        #returnMat[1,:],1个数字依次表示第1行,从第0列开始,到第最后一列,即全部列
        #returnMat[2,:3],1个数字依次表示第2行,从第0列开始,到第2列
        returnMat[index,0:] = listFromLine[0:3]
        
        classLabelVector.append(int(listFromLine[-1]))
        index += 1
    #print(returnMat[1,0:4])
    return returnMat,classLabelVector
复制代码

 

posted @   火军刀  阅读(230)  评论(0编辑  收藏  举报
编辑推荐:
· 软件产品开发中常见的10个问题及处理方法
· .NET 原生驾驭 AI 新基建实战系列:向量数据库的应用与畅想
· 从问题排查到源码分析:ActiveMQ消费端频繁日志刷屏的秘密
· 一次Java后端服务间歇性响应慢的问题排查记录
· dotnet 源代码生成器分析器入门
阅读排行:
· ThreeJs-16智慧城市项目(重磅以及未来发展ai)
· 软件产品开发中常见的10个问题及处理方法
· Vite CVE-2025-30208 安全漏洞
· 互联网不景气了那就玩玩嵌入式吧,用纯.NET开发并制作一个智能桌面机器人(四):结合BotSharp
· MQ 如何保证数据一致性?
点击右上角即可分享
微信分享提示