Perl语言与自然语言处理

上传人:飞*** 文档编号:56635993 上传时间:2018-10-14 格式:PPT 页数:37 大小:397.50KB
返回 下载 相关 举报
Perl语言与自然语言处理_第1页
第1页 / 共37页
Perl语言与自然语言处理_第2页
第2页 / 共37页
Perl语言与自然语言处理_第3页
第3页 / 共37页
Perl语言与自然语言处理_第4页
第4页 / 共37页
Perl语言与自然语言处理_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《Perl语言与自然语言处理》由会员分享,可在线阅读,更多相关《Perl语言与自然语言处理(37页珍藏版)》请在金锄头文库上搜索。

1、Perl语言与自然语言处理,荀恩东,Perl是什么?,Perl是解释性的脚本语言 Larry Wall于1987年,为进行文本处理和系统管理编写。 综合了c,sh, awk和sed的优点。 开放源代码,免费下载安装程序。 Perl不是GUI程序。 Perl是用C程序编写。 Perl的优点 出色卓越的处理文本能力。 是跨平台的编程语言,window,linux 自主内存管理,没有内存泄漏问题。 强大便捷的模块化功能。 下载安装程序 ActivePerl for Windows http:/,一个程序实例,简洁强大的Perl,内容介绍,Perl语言 Perl变量类型 模式匹配 Perl控制结构 P

2、erl在自然语言处理中应用 查词典、词典合并、词频统计、汉语分词 词性标注、 简繁转换 网络机器人、调用Google API Perl其他典型应用 建立CGI网络应用 与数据库的接口 在C语言中,使用Perl,Perl变量类型,简单变量 可以是数值,字符串,不作严格的区分。名字前面加上一个“$” 。 例如: $Data= 123; $string=“123”; 数组名字前面加上一个“”,表示数组变量。 array=(1,2,3,4,5); array=(“a”,”b”,”c”); array=(1,”b”,”c”); 哈希表(hash) -名字前面加上一个“”,表示数组变量。 %hash=(“

3、hello”=“哈罗”,“nihao”=“你好”,“data”=1); %hash=(“hello”,“哈罗”,“nihao”,“你好”,“data”,1); 文件句柄 open(FILEHANDLE,“test.htm“); close(FILEHANDLE); 引用 使用“”来生成引用。 $Pointer=$string;$Pointer=array; $Pointer=hash; 常用于函数调用参数传递,构造复杂数据结构,简单变量类型(1),以$开始 整型 十进制 $x = 12345; 8进制 $x = 020;(16) 16进制 $x = 0x20; (32) 浮点数 11.4 、

4、-0.3 、.3 、 3. 、 54.1e+02 、 5.41e03 $value = 9.01e+21 + 0.01 - 9.01e+21; 字符串,简单变量类型(2),字符串 $Str=“this is a string”; $Str=this is a string; 转义字符双引号内可以包含转义字符和其他变量 $number11; $text = “This text contains the number $number.“; $text = “tThis text contains the numbern”; 单引号内就是字符本身,单引号支持多行赋值 print tThis tex

5、t contains the numbern;,针对简单变量的操作符(3),算术操作符 , , *, *, %, - 整数比较操作符 . !=. =, 字符串比较操作符 lt, gt, le,ge, eq, ne,cmp 字符串操作函数 chop,chomp,substr,length .(连接符) 逻辑操作符 ,数组(1),数组变量 表示以开头 数组的的元素可以是数值、字符串或两者的混合 数组的赋值 array = (2, 3, 4); array = (str1, “tstr2”, “str3”); $str4=“str4”; array = (str1, “tstr2”, $str4);

6、 array = (13,4,5); day_of_month = (“01“31“) array = (ef); array= (a,b, array,g); array = ();,数组(2),数组包含元素的个数 $Size= array; 访问数组元素与遍历 $arrayno; $array=(1,2,3,4,5); $Element=$array0; foreach $Element(array)print “$Element”; for($i=0; $i $filename“); 关闭文件 close( FH ) 读文件 While( )print “$_n”; lines=; 读文

7、件 print FH “This data is $Valuen”;,引用,引用就是指向其他变量的标识。 在被引用变量前加 指向简单变量的引用 $Str=“data“; $Point=$Str; 指向简单变量的引用 array=(“a“,“b“,“c“); $Point=array; 指向简单变量的引用 %hash=(“a“,1,“b“,2,“c“,3); $Point=%hash;,使用引用构造复杂数据结构(1),二维数组 array1=(“a“,“b“,“c“); array2=(“d“,“e“,“f“); array3=(“s“,“t“,“z“); array=(array1,array

8、2,array2); $Pointer=$array0; print “$Pointer“.“n“; print $Pointer2; print $array02; print “$array0-2“.“n“;array1=(1,2);array2=(“a“,“b“); push(array,array1);push(array,array2); print $array01,“n“;print $array11,“n“;,使用引用构造复杂数据结构(2),值为哈希的哈希 %hash1=(“a0“,11,“b0“,12,“c0“,13); %hash2=(“a1“,21,“b1“,22,“c1

9、“,23); %hash3=(“a2“,31,“b2“,32,“c2“,33); %hash=(“a“,%hash1,“b“,%hash2,“c“,%hash3); $Pointer=$hash“a“; key=sort keys(%$Pointer); print key; print $hash“a“a0“; print $hash“b“-“b1“;%Hash1=(“a“,1,“b“,2); %Hash2=(“d“,1,“f“,2); $hash“a“=%Hash1; $hash“b“=%Hash2; print $hash“a“-“b“,“n“;,使用引用构造复杂数据结构(3),值为数组

10、的哈希 array1=(“a“,“b“,“c“); array2=(“d“,“e“,“f“); array3=(“s“,“t“,“z“); %hash=(“a“,array1,“b“,array2,“c“,array3); $Pointer=$hash“b“; print “$Pointer“.“n“; print $hash“c“-2; print $hash“b“0.“n“; foreach (sort keys %hash)$Pointer=$hash$_;foreach ( $Pointer )print “$_ “;print “n“; ,使用引用构造复杂数据结构(4),一个混合数据

11、结构 $Val=12; $String=“data“; array=(“a“,“b“,“c“); %hash=(“a0“,11,“b0“,12,“c0“,13); Struct=($Val,$String,array,%hash); print $Struct0.“n“; print $Struct1.“n“; print $Struct2-2.“n“; print $Struct3-“a0“.“n“; $Pointer=$Struct2; push($Pointer,“d“); print “$Pointer“.“n“; print $Struct2-3; $Pointer=$Struct3; $Pointer“d0“=“14“; print sort keys (%$Struct3),“n“; print sort values (%$Struct3),“n“;,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号