svm特征格式:<label><index1>:<value1><index1>:<value1>....
其中<label> 是训练数据集的目标值,对于分类,它是标识某类的整数(支持多个类);对于回归,是任意实数。<index> 是以1开始的整数,可以是不连续的;<value>为实数,也就是我们常说的自变量。
这里面一个词<index1>:<value1>代表一维,如果要处理的某件事中有很多词是在同一维的比如训练人的特征,有身高,体重...则可以:
1 1:170 2:56 .......
-1 1:140 2:34 ......
不同行里面的特征放在同一样的维度中
如果要处理的事件中特征之间没有关系,比如垃圾短信的特征,顾客,贷款......则要:
1 1:特征1 2:特征2 ......9:特征9
-1 10:特征10 11:特征11.....100:特征100
第二行相当于前9维特征都设置成0,在这个例子里面特征维度是100,相当于在第一行里地10维以后的维度中的特征都设置成了0,即每一行的特征都是100维
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步