查询选取方法及系统的制作方法

上传人:ting****789 文档编号:310006908 上传时间:2022-06-14 格式:DOCX 页数:5 大小:23.26KB
返回 下载 相关 举报
查询选取方法及系统的制作方法_第1页
第1页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《查询选取方法及系统的制作方法》由会员分享,可在线阅读,更多相关《查询选取方法及系统的制作方法(5页珍藏版)》请在金锄头文库上搜索。

1、查询选取方法及系统的制作方法专利名称:查询选取方法及系统的制作方法技术领域:本发明涉及加工技术领域,更具体的说,涉及查询选取方法及系统。背景技术:在对数据库、数据源中的数据进行查询时,现有技术一般会提供多个查询选项(也可称为查询指标或指标),用户选择指标后,还需要配置指标对应的限制条件,并将所有的限制条件以“且”和“或”的逻辑关系组合后,系统形成查询指令,在数据库中进行查询筛选,并展示给用户。在现有技术中,用户无法通过输入自然语言语句来实现对数据的查询和筛选。发明内容有鉴于此,本发明实施例提供了查询选取方法及系统,以解决上述问题。为实现上述目的,本发明实施例提供如下技术方案:一种查询选取方法,

2、至少基于查询选取系统,包括:查询选取系统获取用户输入的自然语言语句;查询选取系统对所述用户输入的自然语言语句进行预处理,得到标准节点序列,所述节点至少包括指标节点和条件节点,所述条件节点包括数字节点、日期节点、字符串节点中的至少一种;查询选取系统根 据指标节点与其他节点之间的关系,构造节点树,所述节点树用于表征指标条件组合;查询选取系统根据所述节点树生成数据查询指令;查询选取系统使用所述数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果; 查询选取系统展示所述筛选结果。一种查询选取系统,包括:获取单元,用于获取用户输入的自然语言;预处理单元,用于对所述用户输入的自然语言进行预处理,得到标

3、准节点序列,所述节点至少包括指标节点和条件节点,所述条件节点包括数字节点、日期节点和字符串节点中的至少一种;节点树构造单元,用于根据指标节点与其他节点之间的关系,构造节点树,所述节点树用于表征指标条件组合;翻译单元,用于将所述节点树翻译成数据查询指令;查询筛选单元,用于使用所述数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果;展示单元,用于展示所述筛选结果。经由上述的技术方案可知,在本发明实施例中,在用户输入自然语言语句后,由查询选取系统自动对自然语言语句进行处理,构成表征指标条件组合的节点树,并根据节点树生成数据查询指令,在数据库中进行查询筛选,并展示给用户,从而实现了用户通过输入自

4、然语言语句来对数据进行查询和筛选。此外,用户只需要输入自然语言语句,不再需要选择指标、设置限制条件,因此,还简化了用户操作,节省了用户的操作时间。为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本发明实施例提供的查询选取系统结构示意图;图2为本发明实施例提供的查询选取方法流程图;图3为本发明实施例提供的查询选取方法另一流程图;图4为本发明实施例提供的查询选取方法又一流程图;图5为本发明

5、实施例提供的节点树示意图;图6为本发明实施例提供的节点树另一示意图;图7为本发明实施例提供的查询选取方法又一流程图;图8为本发明实施例提供的查询选取方法又一流程图;图9为本发明实施例提供的查询选取方法又一流程图10为本发明实施例提供的查询选取方法又一流程图。具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在对数据库、数据源中的数据进行查询时,现有技术一般会提供多个查询选项

6、(也可称为查询指标或指标),用户选择指标后,还需要配置指标对应的限制条件,并将所有的限制条件以“且”和“或”的逻辑关系组合后,系统形成查询指令,在数据库中进行查询筛选,并展示给用户。举例来讲,用户如想查询数学成绩以及语文成绩均超过80分的学生,至少需要选择“数学成绩”、“语文成绩”这两个指标,设置两个限制条件“ 80”,设置两个限制条件为“且”的逻辑关系组合后,系统才形成查询指令,在数据库或数据源中进行查询筛选并展示。因此,在现有技术中,用户无法通过输入自然语言语句来实现对数据的查询和筛选。有鉴于此,本发明实施例提供了查询选取方法和查询选取系统,以解决上述问题。参见图1,上述查询选取系统至少可

7、包括获取单元1、预处理单元2、节点树构造单元3、翻译单元4、查询筛选单元5和展示单元6。基于上述查询选取系统,参见图2,本发明实施例所提供的查询选取方法至少包括如下步骤:S1、查询选取系统(获取单元)获取用户输入的自然语言语句;用户可以用手写、按键或语音输入自然语言语句。因此,上述获取单元具体可包括键盘、麦克风(用于语音输入)、手写笔和触摸屏(手写笔和触摸屏用于手写输入)等。S2、查询选取系统(预处理单元)对用户输入的自然语言语句进行预处理,得到标准节点序列(考虑到后续还将出现标准节点序列,步骤S2中得到的标准节点序列可称为第一标准节点序列)。上述节点至少包括指标节点和条件节点,而条件节点又可

8、包括数字节点、日期节点和字符串节点中的至少一种。S3、查询选取系统(节点树构造单元)根据指标节点与其他节点之间的关系,构造节点树,节点树用于表征指标条件组合;S4、查询选取系统 (翻译单元)根据节点树生成数据查询指令;S5、查询选取系统(查询筛选单元)使用数据查询指令查询数据,并对查询结果进行筛选,得到筛选结果;S6、查询选取系统(展示单元)展示筛选结果。具体的,展示单元可为显示屏。经由上述的技术方案可知,在本发明实施例中,在用户输入自然语言语句后,由查询选取系统自动对自然语言语句进行处理,构成表征指标条件组合的节点树,并根据节点树生成数据查询指令,在数据库中进行查询筛选,并展示给用户,从而实

9、现了用户通过输入自然语言语句来对数据进行查询和筛选的目的。并且,在本发明实施例中,用户只需要输入自然语言语句,而不再需要选择指标、设置限制条件,因此,还简化了用户操作,节省了用户的操作时间。下面将重点介绍步骤S2-S4的细节内容。首先介绍步骤S2。在本发明其他实施例中,参见图3,上述步骤S2可具体包括:S21、将用户输入的自然语言语句进行分词处理,得到多个词或词组;S22、对每一个词或词组构造节点,得到与用户输入的自然语言语句相对应的原始节点序列;原始节点序列中包括至少一个节点。更具体的,可通过配置词典对每个词或词组构造节点,节点类型可包括疑问词节点、指标节点、数字节点、日期节点、逻辑词节点、

10、字符串节点等等,最终得到与用户输入语句相对应的一个语义节点序列。上述数字节点和字符串节点均可作为指标节点的限制条件值。例如,在“三年级五班姓名李明的数学成绩”中,“李明”是一字符串节点,是“姓名”这一指标节点的限制条件值;而在“数学成绩超90分”中,“超90分”这一数字节点是“数学成绩”这一指标节点的条件值。在对数字节点和日期节点的配置中,首先先确定某一词组是数字,然后再确定这些数据是否是日期,如果是,将其构造成日期节点,否则将其构造成数字节点。需要说明的,一个特定的系统(也即在特定应用场景下)可提供查询选项(也即查询指标)是固定的。比如,在学生成绩查询系统中,其可提供的指标包括年级、班级、各

11、科目(数学、语文、地理、历史、生物等)等,是固定的。因此,可利用指标关键词对分词得到的各词或词组进行匹配,从而确定出用户输入的语句中所包含的指标。例如,使用“科目”中数学、语文、地理、历史、生物等指标关键词,对“三年级五班数学成绩超90分,以及语文成绩超过80分的学生”这一语句进行匹配,可匹配出该语句包含“数学”、“语文”两个指标。同理,逻辑词也是固定的,可预先设置逻辑词字典,该字典中包括逻辑关键词“并且”、“和”、“且”、“同时”、“与”、“或”等,使用逻辑关键词对分词后的词或词组进行匹配,可确定其是否是逻辑关系节点。S23、将原始节点序列转换为(下述节点树构造单元可处理的)标准节点序列;由

12、于用户在输入自然语言语句时,带有很大的随意性,因此其对应的节点序列可能是非标准的。仍以上述提及的“三年级五班李明的数学成绩”为例,该句中只出现了“李明”这一词组,但省略了“姓名”,这样,其对应的节点序列只有“李明”这一字符串节点,而缺乏其相应的指标节点姓名”。因此,需要对其补入指标节点(姓名),将其转换成标准节点序列“三年级五班姓名李明的数学成绩”。更具体的,可根据配置规则将用户输入的自然语言语句对应的节点序列转换为节点树构造单元可处理的标准节点序列:首先通过检查关键词汇和匹配特殊句式特征判断原节点序列的句式是否标准,对检查到的非标准句式根据配置文件指定的转换规则转换为标准句式对应的语义节点序

13、列。关键词汇可用正则表达式来表示。举例来讲,用户输入“连续3天下雨”,可使用“连续*天”这一正则表达式对其进行匹配和句式转换,将“连续3天下雨”转换成标准句式“今天下雨,并且昨天下雨,并且前天下雨”。同时,“下雨”是条件节点中的字符串节点,其与“天气状况”这一指标相对应,因此,还需要将指标节点“天气状况”补入,最终转换成的标准节点序列为“今天天气状况下雨,并且昨天天气状况下雨,并且前天天气状况下雨”。需要说明的是,如果用户以语音方式输入语句时,上述步骤S2还包括对语音输入进行文字识别,得到文字识别结果的步骤。从而将语音转化为文字。在得出标准节点序列后,接下来的步骤S3是根据指标节点与其他节点之

14、间的关系,构造节点树。参见图4,步骤S3可具体包括:S31、根据节点之间的位置关系,确定指标条件组合;举例来讲,“三年级五班数学成绩超90分,以及语文成绩超过80分的学生”中,“数学成绩”为指标节点,“超90分”为数字节点(条件节点),并且,“数学成绩”与“超90分”的位置关系是相邻,因此,可根据二者的位置关系,确定“超90分”是“数学成绩”这一指标节点的限制条件,也即“超90分”是“数学成绩”这一指标节点的条件节点。需要说明的是,“超90分”并不是计算机可理解的准确数值范围。因此,需要解析“超90分”这一数字节点,将其转化为“90”的数字节点。而如果数字节点已经包含了准确数值范围,例如,用户

15、输入了“三年级五班数学成绩90”的语句,则不需要对数字节点进行解析。更具体的,在解析时,可将“超”、“大于”、“高于”转化为“”,将“小于”、“少于”、“低于”转化为“”,将“不大于”、“小于等于”、“不超过”、“不高于”转化为“”,将“不小于”、“小于等于”、“不少于”、“不低于”转化为“”。同理,日期节点如果未包含计算机可理解的准确日期范围,则需要对日期节点进行解析转换。反之,则不需要解析日期节点。例如,“今年”并不是计算机可理解的准确日期范围,如果今年为2013年,需要将其转化为日期节点“2013”。相应的,逻辑词节点也需要进行转换,例如,将逻辑词节点“并且”、“和”、“且”、“同时”、

16、“与”等,转换为“and”或“&”,将逻辑词节点“或”、“或者”转换为“or”。以此类推,可最终得到指标条件组合。S32、根据指标条件组合构造节点树。“2013年三年级五班数学成绩超90分,以及语文成绩超过80分的学生”对应的节点树可参见图5。此外,需要说明的是,节点树中的每一指标节点对应一个条件节点。以“连续3年同比增长率超过50%的股票为例”,其实际是三个指标条件的组合:(1),最近一年(假设是2013年)的同比增长率50% ;(2),前推一年(2012年)同比增长率50%;(3),前推两年(2011年)的同比增长率50%。因此,参见图6,“连续3年同比增长率超过50%的股票为例”所对应的节点树中包括三个“同比增长率”指标节点,每一指标节点对应一个条件节点。相应的,上述步骤S4可具体包括:确定节点树中各指标节点对应的数据源;根据数据源的格式要求,将相应指标节点及条件节点翻译成符合数据源格式要求的查询指令。这是因为,不同指标所对应的数据可能存储于不同的数据源或数据库中,而每个数据源所支持的查询指令格式可能也是不一

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号