python_基础学习_02_拆分文件(spilt)
做爬虫经常会有这样的引用场景 ,原始网页存储格式为 url+\t+ html
php 有个explode的 拆分文本行方法,比较方便直接接收列值
list($url,$html)=explode("\t",$line); echo $url."\t".$html."\n";
与之对应的python写法
url,html = line.split("\t") print url+"test"+html
下面的是备忘
#python-string #python中的字符串用单引号''和双引号""标示 strA = 'this is a string' strB = "this is a message!" #打印两个字符串 print("打印两个字符串") print('strA = ' + strA) print('strB = ' + strB) print("#############################") strC = 'I don\'t know anything' strD = '\'Yes\',I know.' print("字符串中的转移字符") print('strA = ' + strC) print('strB = ' + strD) print("#############################") strE = '这是我的blog,欢迎大家来\n我的博客园溜达' print("字符串中的换行") print('strA = ' + strE) print("#############################") strF = 'this is ''message' strG = 'Hongten' strH = strG * 3 print('字符串可以用\'+\'号连接(或者说粘合),也可以用\'*\'号循环') print('strF原有形式为:\'this is \'\'message\'') print('粘合后的strF:' + strF) print('strG原值为:\'Hongten\',strH = strG * 3,此时strH为:' + strH) print("#############################") strI = 'hongtenzone@foxmail.com' print('字符串可以使用下标(索引)查询') print('源字符串strI = \'hongtenzone@foxmail.com\'') print('字符串strI的长度,len(strI) = ') print(len(strI)) print('strI[0] = ' + strI[0]) print('strI[10] = ' + strI[10]) print('strI[-1] = strI[len(strI) - 1]') print('strI[-1] = ' + strI[-1]) print('strI[len(strI) - 1] = ' + strI[len(strI) - 1]) print("#############################") print('Python 字符串不能改写。按字符串索引赋值会产生错误:') print('strI[0] = \'x\',这样就会产生错误啦') print("#############################") print('过大的索引代替为字符串大小,下界比上界大的返回空字符串') print('strI[0:100] = ' + strI[0:100]) print("#############################") print('索引可以是负数,计数从右边开始') print('strI[-2] = ' + strI[-2]) print('strI[-23:] = ' + strI[-23:]) print("#############################") print('不过-0 还是0,所以它不是从右边计数的!') print('strI[0] = ' + strI[0]) print('strI[-0] = ' + strI[-0])
create by cphmvp
email:cphmvp@163.com
爬虫技术交流_crawler QQ群 :167047843