批处理读取文本中的每一行
参考链接:
http://hi.baidu.com/zch11230/blog/item/125ddc8bba61fe15c8fc7aa2.html
在SharePoint迁移中,要同步新旧用户SID,但是用户太多,所以决定用批处理一行行读取导出的User.txt(每一行是一条用户信息),再针对每一条用户记录进行操作。 于是学习参考了上面大侠的一些知识。主要用到的是/f命令,
(想了下,还是整个贴到自己空间来了)
我需要的是要读取每一条的第一列信息,如下格式
ary,Ary Hong,,aaa@163.com,,,,
我是需要用户名ary,于是如下:
@echo off
for /f "delims=," %%i in (users.txt) do ......
每一行中,各信息以“,”分隔,所以定义了 "delims=,"后,就会自动读取以“,”分隔的第一个元素了。
虽然可以读取每一行中所需要的信息,但每次执行批处理的时候都找不到记录,后来才发现时文本文件的编码在作怪,如果文件编码是ANSI,是可以读取的,如果是UniCode就无法识别了。不晓得批处理文件的所有文本处理的命令都是有这个限制的,以后得留心了。
转载自: http://hi.baidu.com/zch11230/blog/item/125ddc8bba61fe15c8fc7aa2.html
FOR这条命令基本上都被用来处理文本,但还有其他一些好用的功能! 看看他的基本格式(这里我引用的是批处理中的格式,直接在命令行只需要一个%号) 参数:FOR有4个参数 /d /l /r /f 他们的作用我在下面用例子解释 可以在CMD输入for /?看系统提供的帮助!对照一下 %%variable 指定一个单一字母可替换的参数。
/d 录(而不是指定目录中的文件组)执行指定的 Command。 系统帮助的格式:FOR /D %%variable IN (set) DO command @echo off 把他保存放在C盘根目录执行,就会把C盘目录下的全部目录名字打印出来,而文件名字一个也不显示! @echo off 这样的话如果你当前目录下有目录名字只有1-3个字母的,就会显示出来,没有就不显示了
@echo off 保存到C盘下执行,会显示什么呢?自己看吧!
/R 当前目录。如果 Set 只是一个句点 (.),则只枚举目录树。 上面我们知道,/D只能显示当前路径下的目录名字,那么现在这个/R也是和目录有关,他能干嘛呢?放心他比 /D强大多了! @echo off 咋们把这个BAT保存到D盘随便哪里然后执行,我会就会看到,他把C盘根目录,和每个目录的子目录下面全部 的EXE文件都列出来了,这里的c:/就是目录了。 再来一个 参数不一样了,这个命令前面没加那个C:/也就是搜索路径,这样他就会以当前目录为搜索路径,比如你这 个BAT你把他防灾d:/test目录下执行,那么他就会把D:/test目录和他下面的子目录的全部EXE文件列出 来!!!
。/L 将通过对 Start# 与 End# 进行比较来执行迭代变量。如果 Start# 小于 End#,就会执行该命令。 如果迭代变量超过 End#,则命令解释程序退出此循环。还可以使用负的 Step# 以递减数值的方式逐步执 行此范围内的值。例如,(1,1,5) 生成序列 1 2 3 4 5,而 (5,-1,1) 则生成序列 (5 4 3 2 1)。语法是: 系统帮助的格式:for /L %% Variable in (Start#,Step#,End#) do Command 例如: @echo off 保存执行看效果,他会打印从1 2 3 4 5 这样5个数字 再看这个例子 执行后是不是吓了一跳,怎么多了5个CMD窗口,呵呵!如果把那个 (1,1,5)改成 (1,1,65535)会有什么结果, 我先告诉大家,会打开65535个CMD窗口....这么多你不死机算你强! 当然我们也可以把那个start cmd改成md %%i 这样就会建立指定个目录了!!!名字为1-65535 看完这个被我赋予破坏性质的参数后,我们来看最后一个参数 /f
含有/F的for详细说明 含有/F的for有很大的用处,在批处理中使用的最多,用法如下: FOR /F ["options"] %%i IN ("string") DO command FOR /F ["options"] %%i IN ('command') DO command
这个可能是最常用的,也是最强的命令,主要用来处理文件和一些命令的输出结果。 file代表一个或多个文件 string 代表字符串 command代表命令 ["options"] 可选 对于FOR /F %%i IN (file) DO command file为文件名,按照官方的说法是,for会依次将file中的文件打开,并且在进行到下一个文件之前将每个文件读取到内存,按照每一行分成一个一个的元素,忽略空白的行,看个例子。 假如文件a.txt中有如下内容:
第1行第1列 第1行第2列 第1行第3列
你想显示a.txt中的内容,会用什么命令呢?当然是type,type a.txt for也可以完成同样的命令: for /f %%i in (a.txt) do echo %%i 还是先从括号执行,因为含有参数/f,所以for会先打开a.txt,然后读出a.txt里面的所有内容,把它作为一个集合,并且以每一行作为一个元素,所以会产生这样的集合,
{“第1行第1列 第1行第2列 第1行第3列”, //第一个元素 “第2行第1列 第2行第2列 第2行第3列”, //第二个元素 “第3行第1列 第3行第2列 第3行第3列”} //第三个元素
集合中只有3个元素,同样用%%i依次代替每个元素,然后执行do后面的命令。 具体过程:
用%%i代替“第1行第1列 第1行第2列 第1行第3列”,执行do后面的echo %%i,显示“第1行第1列 第1行第2列 第1行第3列”, 用%%i代替“第2行第1列 第2行第2列 第2行第3列”,执行echo %%i,显示“第2行第1列 第2行第2列 第2行第3列”, 依次,直到每个元素都代替完为止。
为了加强理解/f的作用,请执行一下两个命令,对比即可明白:
for /f %%i in (a.txt) do echo %%i //这个会显示a.txt里面的内容,因为/f的作用,会读出a.txt中 for %%i in (a.txt) do echo %%i //而这个只会显示a.txt这个名字,并不会读取其中的内容。
通过上面的学习,我们发现for /f会默认以每一行来作为一个元素,但是如果我们还想把每一行再分解更小的内容,该怎么办呢?不用担心,for命令还为我们提供了更详细的参数,使我们将每一行分为更小的元素成为可能。 它们就是:delims和tokens delims 用来告诉for每一行应该拿什么作为分隔符,默认的分隔符是空格和tab键 比如,还是上面的文件,我们执行下面的命令:
for /f "delims= " %%i in (a.txt) do echo %%i
显示的结果是:
第1行第1列
为什么是这样的呢。因为这里有了delims这个参数,=后面有一个空格,意思是再将每个元素以空格分割,默认是只取分割之后的第一个元素。 执行过程是:
将第一个元素“第1行第1列 第1行第2列 第1行第3列”分成三个元素:“第1行第1列” “第1行第2列” “第1行第3列”,它默认只取第一个,即“第1行第1列”,然后执行do后面的命令,依次类推。
但是这样还是有局限的,如果我们想要每一行的第二列元素,那又如何呢? 这时候,tokens跳出来说,我能做到。 它的作用就是当你通过delims将每一行分为更小的元素时,由它来控制要取哪一个或哪几个。 还是上面的例子,执行如下命令:
for /f "tokens=2 delims= " %%i in (a.txt) do echo %%i
执行结果:
第1行第2列 如果要显示第三列,那就换成tokens=3。 同时tokens支持通配符*,以及限定范围。 如果要显示第二列和第三列,则换成tokens=2,3或tokens=2-3,如果还有更多的则为:tokens=2-10之类的。 此时的命令为:
for /f "tokens=2,3 delims= " %%i in (a.txt) do echo %%i %%j
怎么多出一个%%j? 这是因为你的tokens后面要取每一行的两列,用%%i来替换第二列,用%%j来替换第三列。 并且必须是按照英文字母顺序排列的,%%j不能换成%%k,因为i后面是j 执行结果为:
第1行第2列 第1行第3列 对以通配符*,就是把这一行全部或者这一行的剩余部分当作一个元素了。 比如:
for /f "tokens=* delims= " %%i in (a.txt) do echo %%i
执行结果为:
第1行第1列 第1行第2列 第1行第3列 其实就跟for /f %%i in (a.txt) do echo %%i的执行结果是一样的。 再如:
for /f "tokens=2,* delims= " %%i in (a.txt) do echo %%i %%j 执行结果为:
第1行第2列 第1行第3列
用%%i代替第二列,用%%j代替剩余的所有 最后还有skip合eol,这俩个简单,skip就是要忽略文件的前多少行,而eol用来指定当一行以什么符号开始时,就忽略它。 比如:
for /f "skip=2 tokens=*" %%i in (a.txt) do echo %%i 结果为:
第3行第1列 第3行第2列 第3行第3列 用skip来告诉for跳过前两行。 如果不加tokens=*的话,执行结果为:
第3行第1列 不知道怎么回事。 再如,当a.txt内容变成:
.第1行第1列 第1行第2列 第1行第3列 执行for /f "eol=. tokens=*" %%i in (a.txt) do echo %%i结果是:
第3行第1列 第3行第2列 第3行第3列 用eol来告诉for忽略以“.”开头的行。 同样也必须加tokens=*,否则只会显示“第3行第1列”
在For命令语句的参数F中,最难理解的就是Delims和Tokens两个选项,本文简单的做一个比较和总结。
二、tokens |