太原理工大学软件工程课程设计实验.doc

上传人:灯火****19 文档编号:138003561 上传时间:2020-07-13 格式:DOC 页数:15 大小:432KB
返回 下载 相关 举报
太原理工大学软件工程课程设计实验.doc_第1页
第1页 / 共15页
太原理工大学软件工程课程设计实验.doc_第2页
第2页 / 共15页
太原理工大学软件工程课程设计实验.doc_第3页
第3页 / 共15页
太原理工大学软件工程课程设计实验.doc_第4页
第4页 / 共15页
太原理工大学软件工程课程设计实验.doc_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《太原理工大学软件工程课程设计实验.doc》由会员分享,可在线阅读,更多相关《太原理工大学软件工程课程设计实验.doc(15页珍藏版)》请在金锄头文库上搜索。

1、文本文件单词的检索与计数专业:软件工程 班级: 1227班 姓名: 王晓春 学号: 2012005774 同组人:王晓春 闫瑞娟 张泽磊 组长:王晓春 完成日期: 2014.6.25 一【问题描述】串是非数值处理中的主要对象,如在信息检索、文本编辑、符号处理等许多领域,得到越来越广泛的应用。在高级语言中也引入了串数据类型概念,并且串变量与其他变量(如整型、实型等)一样,可以进行各种运算。然而,在各种不同类型的应用中,所处理的串有不同的特点,要想有效地实现串的处理,就必须熟悉串的存储结构及其基本运算。本课程设计的目的就是熟悉串类型的实现方法和文本模式匹配方法,熟悉如何利用模式匹配算法实现一般的文

2、本处理技术。本课程设计分两步:首先,设计出串定位算法(即模式匹配算法)及其实现;然后,再利用串定位算法设计文本文件的检索及单词的计数等操作。二【设计需求及分析】1.设计要求 1.1串模式匹配算法的设计要求在串的基本操作中,在主串中查找模式串的模式匹配算法即求子串位置的函数Index(S,T),是文本处理中最常用、最重要的操作之一。所谓子串的定位就是求子串在主串中首次出现的位置,又称为模式匹配或串匹配。模式匹配的算法很多,在这里只要求用最简单的朴素模式匹配算法。该算法的基本思路是将给定子串与主串从第一个字符开始比较,找到首次与子串完全匹配的子串为止,并记住该位置。但为了实现统计子串出现的个数,不

3、仅需要从主串的第一个字符位置开始比较,而且需要从主串的任一给定位置检索匹配字符串,所以,首先要给出两个算法:1标准的朴素模式匹配算法2给定位置的匹配算法1.2文本文件单词的检索与计数的设计要求要求编程建立一个文本文件,每个单词不包含空格且不跨行,单词由字符序列构成且区分大小写;统计给定单词在文本文件中出现的总次数;检索输出某个单词出现在文本中的行号、在该行中出现的次数以及位置。该设计要求可分为三个部分实现:其一,建立文本文件,文件名由用户用键盘输入;其二,给定单词的计数,输入一个不含空格的单词,统计输出该单词在文本中的出现次数;其三,检索给定单词,输入一个单词,检索并输出该单词所在的行号、该行

4、中出现的次数以及在该行中的相应位置。1建立文本文件2给定单词的计数3检索单词出现在文本文件中的行号、次数及其位置4主控菜单程序的结构2.概要设计示例如下:2.6算法设计 朴素模式匹配算法该算法的基本思想是:设有三个指针i,j,k,用i指示主串S每次开始比较的位置;指针j,k分别指示主串S和模式串T中当前正在等待比较的字符位置;一开始从主串S的第一个字符(i=0;j=1)和模式T的第一个字符(k=0)比较,若相等,则继续逐个比较后续字符(j+,k+)。否则从主串的下一个字符(i+)起再重新和模式串(j=0)的字符开始比较。依此类推,直到模式T中的所有字符都比较完,而且一直相等,则称匹配成功,并返

5、回位置i;否则返回-1,表示匹配失败。顺序串的模式匹配算法如下:int index(SString S, SString T) /求子串T在主串S中首次出现的位置int i,j,k,m,n;m=T.length; /模式串长度赋mn=S.length; /目标串长度赋nfor (i=0; i=n-m; i+) j=0; k=i; / 目标串起始位置i送入k while (j=m & s.chk=t.chj) k+; j+; /继续下一个字符的比较 if (j=m) /若相等,则说明找到匹配的子串,返回匹配位置i,/否则从下一个位置重新开始比较 return i; /endforreturn -

6、1; /endIndex 给定位置的串匹配算法该算法要求从串S1(为顺序存储结构)中第k个字符起,求出首次与字符串S2相同的子串的起始位置。该算法与上面介绍的模式匹配算法类似,只不过上述算法的要求是从主串的第一个字符开始,该算法是上述算法的另一种思路:从第k个元素开始扫描S1,当其元素值与S2的第一个元素的值相同时,判定它们之后的元素值是否依次相同,直到S2结束为止。若都相同,则返回当前位置值;否则继续上述过程,直至S1扫描完为止,其实现算法如下:Int PartPosition(SString S1, SString S2, int k)int i, j;i=k-1; /扫描s1的下标,因为

7、c中数组下标是从0开始,串中序号相差1j=0; /扫描s2的开始下标while (is1.length & j=s2.length) return i- s2.length; /表示s1中存在s2,返回其起始位置else return -1; /表示s1中不存在s2, 返回-1 /函数结束说明:以上两个算法可统一为一个算法,即在子串定位算法Index(S,T)的参数中增加一个起始位置参数即可。2.7各模块及其伪码:1.建立文本文件建立文件的实现思路是:(1)定义一个串变量;(2)定义文本文件;(3)输入文件名,打开该文件;(4)循环读入文本行,写入文本文件,其过程如下: While (不是文件

8、输入结束) 读入一文本行至串变量;串变量写入文件;输入是否结束输入标志;(5)关闭文件。2给定单词的计数该功能需要用到前一节中设计的模式匹配算法,逐行扫描文本文件。匹配一个,计数器加1,直到整个文件扫描结束;然后输出单词出现的次数。其实现过程如下:(1)输入要检索的文本文件名,打开相应的文件;(2)输入要检索统计的单词;(3)循环读文本文件,读入一行,将其送入定义好的串中,并求该串的实际长度,调用串匹配函数进行计数。具体描述如下:While (不是文件结束) 读入一行并到串中; 求出串长度; 模式匹配函数计数;(4)关闭文件,输出统计结果。3.检索单词出现在文本文件中的行号、次数及其位置这个设

9、计要求与上一个类似,但要相对复杂一些。其实现过程描述如下:(1)输入要检索的文本文件名,打开相应的文件;(2)输入要检索统计的单词;(3)行计数器置初值0;(4)while (不是文件结束) 读入一行到指定串中; 求出串长度; 行单词计数器置0; 调用模式匹配函数匹配单词定位、该行匹配单词计数; 行号计数器加1; If (行单词计数器!=0) 输出行号、该行有匹配单词的个数以及相应的位置;2.8函数调用关系主程序CreatTextFile()SubStrCount() SubStrInd()PartPosition()三【设计功能的实现】#include stdafx.h#include#in

10、clude#define MaxStrSize 256 /根据用户需要自己定义大小typedef structchar chMaxStrSize; /ch是一个可容纳256个字符的字符数组int length;SString; /定义顺序串类型int PartPosition(SString s1, SString s2, int k)/检索单词出现在文本文件中的位置int i, j;i=k-1; /扫描s1的下标,因为c中数组下标是从0开始,串中序号相差1j=0; /扫描s2的开始下标while (is1.length&j=s2.length)return i-s2.length;else

11、return -1; /表示s1中不存在s2,返回-1 /表示s1中不存在s2,返回其起始位置 /函数结束void CreatTextFile()SString S;char fname10, yn;FILE *fp;printf(输入要建立的文件名: );scanf(%s, fname);fp=fopen(fname,w);yn=n; /输入结束标志初值while(yn=n|yn=N)printf(请输入一行文本:);gets(S.ch);gets(S.ch);S.length=strlen(S.ch);fwrite(&S, S.length, 1, fp);fprintf(fp,%c, 1

12、0); /是输入换行printf(结束输入吗?y or n: );yn=getchar();fclose(fp); /关闭文件printf(建立文件结束!);void SubStrCount()FILE *fp;SString S,T; /定义两个串变量char fname10;int i=1,j,k;printf(输入文本文件名: );scanf(%s, fname);fp=fopen(fname ,r);printf(输入要计数的单词或字符串:);scanf(%s, T.ch);T.length=strlen(T.ch);while(!feof(fp)/扫描整个文件文本/fread(&S.ch,1,sizeof(S),fp); /读入一行文本memset(S.ch,0, 256);fgets(S.ch,100,fp);S.length=strlen(S.ch);k=0; /初始化开始检索位置while(kS.length-1) /检索整个主串Sj=PartPosition(S,T,k);if(j0)break;elsei+; /单词计数器加1k=j+T.length; /继续下一字串的检索printf(

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号