适合初学者的perl的文件操作

上传人:kms****20 文档编号:41294529 上传时间:2018-05-29 格式:DOC 页数:10 大小:32KB
返回 下载 相关 举报
适合初学者的perl的文件操作_第1页
第1页 / 共10页
适合初学者的perl的文件操作_第2页
第2页 / 共10页
适合初学者的perl的文件操作_第3页
第3页 / 共10页
适合初学者的perl的文件操作_第4页
第4页 / 共10页
适合初学者的perl的文件操作_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《适合初学者的perl的文件操作》由会员分享,可在线阅读,更多相关《适合初学者的perl的文件操作(10页珍藏版)》请在金锄头文库上搜索。

1、适合初学者的适合初学者的 PerlPerl 的文件操作的文件操作为了更好的控制文件的打开方式,可以使用 sysopen() 函数: use Fcntl; sysopen(FH, $filename, O_RDWR|O_CREAT, 0666) or die “Cant open $filename for reading/writing/creating : $!“; 函数 sysopen() 带有四个参数,第一个是同 open()函数类似的文件句柄参数,第二个参数是不带模式信息的文件名,第三个参数是模式参数,由 Fcntl 模块提供的逻辑 OR 运算组合起来的常数构成,第四个参数(可选),为

2、八进制属性值(0666 表示数据文件, 0777 表示程序)。如果文件可以被打开,sysopen() 返回 true,如果打开失败,则返回 false。 不同于 open()函数,sysopen()不提供模式说明的简写方式,而是把一些常数组合起来,而且,每个模式常数有唯一的含义,只有通过逻辑 OR 运算才能将它们组合起来,你可以设置多个行为的组合。 O_RDONLYRead-only O_WRONLY Write-only O_RDWR Reading and writing O_APPEND Writes go to the end of the file O_TRUNC Truncate

3、the file if it existed O_CREAT Create the file if it didnt exist O_EXCLError if the file already existed (used with O_CREAT) 当你需要小心行事的时候,就使用 sysopen() 函数,例如,如果你打算添加内容到文件中,如果文件不存在,不创建新文件,你可以这样写: sysopen(LOG, “/var/log/myprog.log“, O_APPEND, 0666) or die “Cant open /var/log/myprog.log for appending: $

4、!“; 读入单个记录有一个容易的方法读入 filehandles:用 操作符。在标量内容下,它返回文件中的下一个记录,或者返回未定义出错信息。我们可以使用它来把一行读入到一个变量中: $line = ; die “Unexpected end-of-file“ unless defined $line; 在循环语句中,我们可以这样写: while (defined ($record = ) # long-winded # $record is set to each record in the file, one at a time 因为要大量进行这样的工作,通常再进行一下简化, 把记录放到$

5、_ 中,而不是$record 中: while () # $_ 每次为文件中的一个记录 在 Perl 5.004_04 中,我们可以这样做: while ($record = ) # $record 每次为文件中的一个记录 defined() 将自动加上,在 Perl 5.004_04 以前的版本中,该命令给出一个警示。要了解所用的 Perl 版本,可在命令行下打入: perl -v 一旦我们读出了一个记录,通常打算去掉记录分隔符,(缺省值为换行符字符): chomp($record); Perl 4.0 版本仅有 chop()操作,去掉串的最后一个字符, 不管该字符是什么。chomp() 没

6、有这么大的破坏性,如果有行分隔符存在,它仅去掉行分隔符。如果你打算去掉行分隔符,就用 chomp() 来代替 chop()。读入多个记录 如果你调用,返回文件中剩余的记录。如果你处于文件尾,则返回空表: records = ; if (records) print “There were “, scalar(records), “ records read.n“; 在下面的一步中,进行赋值和测试两项工作: if (records = ) print “There were “, scalar(records), “ records read.n“; chomp() 也可适用对数组操作: rec

7、ords = ; chomp(records); 对于任何表达式,都可以进行 chomp 操作,故你可以在下面的一步中这样写: chomp(records = ); 什么是记录? 记录的缺省定义为:“行” 。 记录的定义由$/ 变量控制的,该变量存放所输入的记录的分隔符,因为换行符字符(根据定义!)是用来分隔行的,故其缺省值为串“n” 。 例如,你可以用任何你想要替换的符号来代替“n” 。 $/ = “;“; $record = ; # 读入下一个用分号分隔的记录 $/可以取其它两个有趣的值:空串(“) 和 undef。 读入段落 $/ =“的写法是用来指示 Perl 读入段落的,段落是由两个

8、或两个以上的换行符构成的文本块。这不同于设置为“nn“,后者仅读入由两行组成的文本块。在这种情况下,将出现这样一个问题:如果有连续的空行存在,例如“textnnnn” ,你既可以把它解释为一个段落 (“text“),也可以解释为两个段落 (“text“, 后面跟两个换行符,以及一个空段落,后面跟两个空行。) 在读入文本时,第二个解释用途不大。如果你正在读的段落出现上述情况,你不必过滤出“空”段落。 $/ = “nn“; while () chomp; next unless length; # 跳过空段 # . 你可以把 $/设置为 undef,它用于读入后面跟着两个或多个换行符组成的段落:

9、undef $/; while () chomp; # . 读入整个文件 $/ 的其它有趣的值为 undef。如果设置为该值,就将告诉Perl,读命令将把文件的剩余部分作为一个串返回: undef $/; $file = ; 因为改变了 $/的值,将会影响以后的每次读操作,而不仅是下一个读操作。通常,你需要将该操作限制在局部。通过下面的例子,可以把文件句柄的内容读入到一个串中: local $/ = undef; $file = ; 记住:Perl 变量可读入很长的串。尽管你的文件大小不可以超出你的虚拟内存容量的限度,你仍可以读入尽可能多的数据。 用正则表达式对文件进行操作 一旦你有个包含了整

10、个串的变量,你可以使用正则表达式,对整个文件进行操作,而不是对文件中的某个块进行操作。有两个有用的正则表达式标记/s 和/m。一般,Perl 的正则表达式对行进行处理,你可以这样写: undef $/; $line = ; if ($line = /(b.*grass)$/) print “found $1n“; 如果把我们的文件填入如下内容: browngrass bluegrass 则输出为: found bluegrass 它没有找到“browngrass” ,这是因为$ 仅在串尾寻找其匹配, (或者在串结束前的一行)。如果在包含很多行的串中,用“ 和“$“ 来匹配,, 我们可以使用 /

11、m (“multiline“) 选项: if ($line = /(b.*grass)$/m) 现在程序会把如下的信息输出: found browngrass 类似地,句点可以匹配除了换行符之外的所有字符: while () if (/19(.*)$/) if ($1 20) $year = 2000+$1; else $year = 1900+$1; 如果我们从文件中读入“1981” ,$_ 将包含“1981n” 。正则表达式中的句点匹配“8”和“1”, 而不匹配“n” 。这里正需要这样做,因为换行符不是日期的组成部分。 对于一个包含很多行的串,我们也许要提取其中的大的块,这些块可能会跨越行

12、分隔符。在这种情况下,我们可以使用 /s 选项,并用句点来匹配除了换行符以外的所有字符。 if (m(.*?)s) print “Found bold text: $1n“; 此处,我用了来表示正则表达式的起始和结束,而不用斜杠,所以,我就可以告诉 Perl 我正在匹配,起始字符为“m“,结束字符为“s“。你可以把/s 和/m 选项组合使用: if (m(.*?)sm) # . 总结 有两种方法打开文件:open()函数的特点是快速简捷,而sysopen()函数功能强大而复杂。通过 操作符,可以读入一个记录,$/ 变量可以让你控制记录是什么。如果你打算把很多行的内容读入到一个串中,不要使用忘记/s 和/m 这两个正则表达式标记。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号