5/31 datesets.py 理解,试着解决问题
datesets.py中
anno = annotation.strip().split(" ")
1)split()方法
split() 通过指定分隔符对字符串进行切片,如果参数 num 有指定值,则分隔 num+1 个子字符串
str.split(str="", num=string.count(str)) str -- 分隔符,默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等。 num -- 分割次数。默认为 -1, 即分隔所有。
返回分割后的字符串列表。
例如
输入
str = "Line1-abcdef \nLine2-abc \nLine4-abcd"; print str.split( ); # 以空格为分隔符,包含 \n print str.split(' ', 1 ); # 以空格为分隔符,分隔成两个
输出
['Line1-abcdef', 'Line2-abc', 'Line4-abcd'] ['Line1-abcdef', '\nLine2-abc \nLine4-abcd']
源自 https://www.runoob.com/python/att-string-split.html
2)strip()方法
strip() 方法用于移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。
注意:该方法只能删除开头或是结尾的字符,不能删除中间部分的字符。
str.strip([chars]); chars -- 移除字符串头尾指定的字符序列。 返回移除字符串头尾指定的字符生成的新字符串。
例如
输入
str = "00000003210Runoob01230000000"; print str.strip( '0' ); # 去除首尾字符 0 str2 = " Runoob "; # 去除首尾空格 print str2.strip();
输出
3210Runoob0123
Runoob
源自 https://www.runoob.com/python/att-string-strip.html
于是
anno = annotation.strip().split(" ") 作用是
把annotation文件(注释文件)内容中首尾的空格去掉(txt文档后面会有大量空格),
并且 文档内容中 以空格或者换行为分隔符将各个元素分开来,用" "标注出来。