TextForever使用说明书

上传人:cn****1 文档编号:466856162 上传时间:2022-10-04 格式:DOC 页数:14 大小:49.51KB
返回 下载 相关 举报
TextForever使用说明书_第1页
第1页 / 共14页
TextForever使用说明书_第2页
第2页 / 共14页
TextForever使用说明书_第3页
第3页 / 共14页
TextForever使用说明书_第4页
第4页 / 共14页
TextForever使用说明书_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《TextForever使用说明书》由会员分享,可在线阅读,更多相关《TextForever使用说明书(14页珍藏版)》请在金锄头文库上搜索。

1、TextForever 使用说明书 作者:佚名 转贴自:Internet 作者:马健使用说明 一、软件安装/删除 二、软件使用Q:TextForever是什么?A:这是一个专为整理电子版小说而开发的工具,包括HTML到文本文件的转换、文件合并、文件切分、段落合并、段落切分、内码转换(只能在Win 2k/XP下用)、文本替换、HTML整理、文本抽取、正则表达式(需要IE 5.5以上版本的支持)、tcr文件压缩/解压等功能。Q:TextForever收费吗?A:TextForever是一个“友情软件”(Friendware),用户在承诺不用于商业目的,也不对文件及其附件进行任何更改的条件下,不需要

2、为使用该软件负任何费用,最多是在某个讨论区看到我发帖子灌水时(我的ID一般是strnghrs),进去捧个人场,作为友情回报;或者在年节时发个email问声好(所以叫“友情软件”)。我承诺绝不在程序中暗藏任何商业广告、木马,但不承诺为使用TextForever的后果承担任何责任。如果您需要将它用于商业目的,或加入您的网站,请与我联系,否则保留追究一切责任的权利。Q:TextForever在使用上有什么限制?A:部分功能对软件环境有所要求:在“Html-Text”功能中,如果选择了“使用IE内核”,而网页又是utf-8编码,则可以选择将结果转换成Unicode或ANSI,ANSI使用的是系统缺省字

3、符集(简体中文Windows 2000/XP的缺省字符集为GB2312)。 在“编码转换”功能中,为了省事,转码过程使用的是Windows本身提供的标准API接口。由于转码过程中需要用Unicode作为中间码,因此此功能不能在对Unicode支持非常有限的Windows 95/98/me下使用,只能在支持GBK/Big5/Shift JIS代码页的2000/XP下使用。正常情况下,只要IE能够正常显示中文简体、中文繁体、日文网页,即可正常转换。 “正则表达式”功能需要IE 5.5以上版本的支持。 所有功能均针对ANSI编码的纯文本文件,不支持UNICODE编码的文件。 Q:文件转换、文件合并功

4、能好理解,段落合并、段落切分是干什么的?A:段落合并其实就是某些软件所吹嘘的“自动分段”功能:在转换、识别出来的文本文件中,往往在一个自然段中间加入了若干回车/换行符,成了一行一行的了,因此需要将这些多余的回车/换行符去掉,只在自然段结尾才出现回车/换行符。有人喜欢把这个功能称为“自动分段”,我更喜欢称为“段落合并”。段落切分是段落合并的逆过程。段落合并完成后,在某些软件下阅读时可能因为行太长,给阅读带来不便,因此需要按照指定的行长对段落进行切分,切成一个一个短行。Q:tcr功能是干什么用的?A:tcr的全称是Text Compression for Reader,是一种在手机和PDA上看的电

5、子书格式,此功能用来将txt文件打包成tcr格式,或将tcr格式解包。如果您只打算在PC上看书,相信您不会用到这个功能。tcr虽然也是一种文本压缩格式,但是专门针对手机和PDA这种存储空间和处理能力都很有限的环境,压缩能力和zip、rar当然不能比,不过总比没有强。所以在手持设备能够处理象zip和rar这样复杂的文件之前,我相信都会保持其流行趋势。Q:为什么要开发TextForever?A:我曾经极度热衷于在PC上看小说,但是从网上下载的网页多半不适合直接离线浏览,需要进行转换、整理等,然后才能符合我的收藏标准。现成的HTML到TXT的转换工具有不少,但是集转换、合并、分段、替换等功能于一体的

6、好像还没有,尤其是分段工具,多半分完段后都会有哭笑不得的感觉,所以我才自己开发了这个工具。后来我又开始在手机上看小说,所以又加了tcr压缩/解压、文件切分等功能。使用说明一、软件安装/删除本软件为纯正的绿色软件,不需要安装,下载ZIP包后直接展开、运行即可。删除时删除可执行文件和帮助文件即可。软件包中仅包含下列两个文件,如果有其它的,保证不是我加的,请不要犹豫,立刻删除:TextForever.exe。可执行文件。 TextForever.htm。本帮助文件。 另外如果在运行过程中改变了参数值,会自动生成TextForever.ini文件,删除时可以一起删除。单独删除TextForever.i

7、ni文件后重新运行TextForever,所有参数将恢复成缺省值,相当于点击了“恢复”按钮。二、软件使用注意:TextForever会自动记忆您所设置的参数值(记录在TextForever.ini文件中),点击“恢复”按钮可以将所有参数恢复到缺省值。1、HTML文件到文本文件的转换(HTML-Text)根据需要设置选项(也可以什么不选,直接使用预设值),点击“开始转换”按钮,在弹出的对话框中选择需要转换的文件(按住Ctrl键或Shift键点击文件,即可选多个),然后点“打开”或“Open”按钮即可。如果转换出来的内容不对,可能是因为真正的内容是用javascript动态生成的,可以选择“使用I

8、E内核”,然后再点“开始转换”,重新试一遍。这个选项相当于IE的“另存为文本文件”功能,用缺省选项搞不定的网页,都可以用这个选项试试看。与在IE中打开网页不同的是,如果网页中有错,这里不会弹出错误对话框要求调试网页,而是直接跳过,反正错误对获取文本没有什么影响。另外如果使用IE内核,而网页又是utf-8编码,则可以选择将结果转换成Unicode或ANSI,ANSI使用的是系统缺省字符集(简体中文Windows 2000/XP的缺省字符集为GB2312)。2、文件合并(Merge Files)一般网站刊登电子版小说时,都是一章一个文件,因此在将HTML文件转换成TXT文件后,一般还需要按照章节顺

9、序将转换出来的诸多TXT文件合并成一个文件。使用方法:点击“选择”按钮,在弹出的对话框中输入合并后的文件名,然后点“开始”按钮,在弹出的对话框中选择需要合并的文件即可。注意:文件的合并顺序,等同于在点“开始”按钮后,弹出的对话框中“文件名”(File Name)项中的显示顺序。通常最先选择的文件将排在末尾,而最后选择的文件将排在开头。最简单的选择方法:先选择最后一个文件,然后按住Shift健,选择第一个文件;或者先选择最后一个文件,然后按住Ctrl健,倒序选择其余文件。3、段落合并(Paragraph)在把HTML转换成TXT文件后,由于去掉了HTML中的段落控制,转出来的文件看起来可能会参差

10、不齐,需要重新合并、分段。使用方法:按照界面上标示出来的1、2、3顺序,先设置“源文件段落开始标志”选项,再设置“输出文件段落控制”选项,最后选择源文件。如果是对单个文件进行处理,则在“选择源文件”框中,先点“选择.”按钮选择源文件(如果前面做过文件合并,这里会自动填入合并后的文件名,则不再需要选择),再点“开始合并”按钮开始合并;如果是对多个文件进行操作,直接点“对多个文件中的段落进行合并.”按钮,然后在弹出的对话框中选择需要操作的所有文件(按住Ctrl键或Shift键点击文件,即可选多个)。选项说明:“源文件段落开始标志”框指定分段条件,即在输入文件中,满足什么样的条件算一个段落。这样的条

11、件可以有4个:以2个或指定个数的中文空格开头。 以4个或指定个数的英文空格开头。 上一行的长度比平均行长短少1/20。一般这个条件用于OCR出来、没有整理过的文件。如下面这段文字:他很专注的检阅着自己刚获得的新领土。 虽然自己对空气中的这股刺鼻甜味并不是很喜欢,但只要习惯之后也就没什么。 他在这块领地上绕了整整一圈。看来这里似乎没有任何敌人的样子。 他抬起头来望着一道闸门,刚才自己就是从这里出发的。虽然他看不懂门上那块 牌子的文字,不过那里确实是写着海德伯爵城馆:帝国中最小不隆咚的贵族城 馆。 他端正的坐在门前,并盼望那扇门能够马上开启。因为自己一路睡到刚刚才醒的 关系,被关在门外也是不得已的

12、。 然而,那扇门却没有任何开启的迹象。 很显然,每一段的最后一行都要比其它行短。 后面跟一个空行。 “输出文件段落控制”框指定输出格式,可以指定的内容包括:段落的引导字符:可以是2个中文空格、4个英文空格或者什么也没有。 在段落后面加一个空行。 删除原文文本行的引导空格。 删除原文文本行的末尾空格。 4、段落切分(Reparagraph)有时候在用段落合并功能对原文中的段落进行合并、整理后,还需要按照指定的行宽,对段落进行分行,避免在没有自动环绕功能的浏览器上出现横向滚动条。段落合并功能与段落切分功能互为逆过程,如果对切分结果不满意,可以合并后重新切分。使用方法:按照界面上标示出来的1、2、3

13、顺序,先设置“输出段落”选项,再设置源文件是否保留备份,最后选择源文件。如果是对单个文件进行处理,则在“选择源文件进行操作”框中,先点“选择.”按钮选择源文件(如果前面做过文件合并,这里会自动填入合并后的文件名,则不再需要选择),再点“开始切分”按钮开始切分;如果是对多个文件进行操作,直接点“对多个文件中的段落进行切分.”按钮,然后在弹出的对话框中选择需要操作的所有文件(按住Ctrl键或Shift键点击文件,即可选多个)。如果切分结果出现行末最后一个字节是半个汉字,则该汉字被分到下一行,以免出现乱码;如果切分结果中,行末会出现把一个英文单词劈成两半,则整个单词分到下一行;如果行末是英文空白、标

14、点符号,则按照习惯,即使这些字符超出最大行长,也不分到下一行。选项说明:“最大行长”项说明分行的行长,以英文字符为单位。注意一个中文字符等于两个英文字符。 “段落开头添加”选项设置分行后段落的引导字符,可以是2个中文字符、4个英文字符或者什么也没有。 “在段落后添加空行”选项说明是否需要在段落后加一个空行。 5、编码转换(GB/GBK/Big5)这个功能可以实现GB、GBK、Big5、Unicode码的相互转换,及从日文Shift JIS到中文GB 2312的单向转换。为了省事,转码过程使用的是Windows本身提供的标准API接口。由于转码过程中需要用Unicode作为中间码,因此此功能不能

15、在对Unicode支持非常有限的Windows 95/98/me下使用,只能在支持GBK/Big5/Shift JIS代码页的2000/XP下使用。正常情况下,只要IE能够正常显示中文简体、中文繁体、日文网页,即可正常转换。使用方法:先设置文件选项、转码选项,然后点“开始”按钮,选择需要转换的文件即可。转码后如果出现固定的错别字,可以用“文本替换”功能进行修正。文件选项说明:覆盖原文件:转换后的文件将覆盖转换前的文件。 原文件另存为 bak 文件:转换后的文件不会覆盖转换前的文件,转换完成后将在原文件名后加后缀.bak。 转码选项说明:左侧为原文件中的汉字编码,右侧为转换后的汉字编码。GB码:按照国家标准GB2312-80编排,包括全部简体字及常用符号。在中文简体版的Windows下显示为简体,在繁体版Windows下显示为乱码。 GBK码:是国家技术监督局1995年为中文Windows 95所制定的新的汉字内码规范(其中GB表示国标,K表示扩展)。该规范在字汇一级上支持ISO10646和GB13000中的全部中日韩(CJK)汉字,并与国家标准GB2312-80信息处理交换码相兼容。如果在中文简体版的Windows 95/98/2000下看到繁体中文或繁简

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 建筑资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号