|
题目:
雅宝题库答案:
****此区域为收费内容**** 需支付 1 知识币后可查看,1币=0.01元查看答案
雅宝题库解析:
文本是计算机中最常见的数据格式,在信息世界里,存在着大量的文本处理需求。对文本进行处理的应用非常广泛,常见的文本处理包括文本过虑、关键信息抽取、文本内容检索、文本内容改写、文档自动生成、文本信息统计与分析等。现有的常用文本处理解决方案有正则表达式,GATE框架,Apache Lucene框架,以及各种相对具体文本处理的处理程序。这些现有的文本处理解决方案及框架,存在着一些缺点:具体的文本处理系统都是针对某一具体算法或某种文本处理需求,编写专门的处理程序来实现,难以满足可通用可扩展的文本处理需求,对用户而言,各种文本处理算法,理解和实现起来也比较困难;GATE和Lucene框架的应用,需要二次开发,才能面向普通用户使用。因此,传统的文本处理解放方案及已有的文本处理框架,难以满足既对开发者可通用可扩展,又对普通用户简单易用的需求。本文设计一种通用的文本处理框架,它包括使用规则来描述文本处理的具体逻辑,同时设计相应的规则引擎来执行规则,并开发文本处理框架的IDE,从而使该文本处理框架具备可视化功能,简化定制和生成具体的文本处理程序的过程。使用规则来描述文本处理逻辑,是通过分析一般性的文本处理过程,可以将文本处理逻辑归纳为三个基本步骤:匹配、修改、写回,由此,设计了相应的规则数据模型,包括原子规则、规则集及前置条件等,来描述具体的文本处理逻辑。规则引擎用于解释并执行规则。通过定义规则描述文本逻辑,设计规则引擎执行具体的文本处理,从而实现文本处理逻辑与处理程序的分离。基于Eclipse RCP平台的文本处理框架IDE的开发,可以使普通用户通过可视化图形界面,定制文本规则,完成其所需的文本处理。本文最后提供两个实例来演示该文本处理框架的具体应用,同时通过与其它文本处理工具的功能及性能对比,验证本文所提供的文本处理框架的实用性和有效性。 |
上一篇:合同管理系统的设计与实现下一篇:某保险公司表单处理系统的设计与实现
|