首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于100万字的973汉语树库,按照语法功能分布的理论,从汉语自动句法分析和语言知识库构建的角度,构建一个相对系统化和多层次的语法知识库。该语法知识库由汉语词语、短语实例、短语结构、句法规则等知识组成。汉语词语知识共统计51 390个汉语词汇的58种语法知识,短语实例知识共获取3 836个汉语短语实例的58种语法知识,短语结构知识共抽取26种短语结构的58种知识,句法规则共有900条记录知识组成。该语法知识库的构建不仅为汉语自动句法分析和语言学研究提供语法知识,而且为更大规模的语法知识库构建打下基础。  相似文献   

2.
针对改善句法分析整体性能的需求,从可视化编辑学习的规则和词典、树形显示和操作句法分析结果两方面入手,提出并构建一个中英文句法分析系统及验证平台。对平台的设计思想、具体实现和关键技术进行详细的介绍,指出存在的问题和改善的方法。  相似文献   

3.
张亮  黄河燕  王树梅 《情报学报》2006,25(4):433-440
搜索引擎是Internet上重要的信息检索工具。同时Internet上丰富的语言资源是汉语研究的重要内容。然而,服务于汉语分析的专业搜索引擎的研究与开发,目前还处于起步阶段。本文介绍了搜索引擎的基本原理,分析了Internet汉语研究的内在要求及其基本现状,详细阐述了一个面向汉语分析研究的搜索引擎的研究与设计,包括系统体系结构的设计、系统的汉语分析功能的描述以及实验结果的分析。初步结果表明,面向汉语分析的搜索引擎可以为汉语研究提供很好的帮助。  相似文献   

4.
基于神经网络的汉语自动分词系统的设计与分析   总被引:14,自引:1,他引:14  
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。  相似文献   

5.
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。  相似文献   

6.
自然语言理解是计算语言学及人工智能的一个重要分支,本文阐述了自然语言理解的基本流程、相关技术,重点介绍了Glue semantics 和DRT这两个理论。笔者设计开发了基于Glue semantics 和DRT的语义计算的系统平台。本文对平台的设计思想、具体实现和关键技术进行了详细的介绍,并指出了一些存在的问题。  相似文献   

7.
颜色是一些Web资源的重要属性,颜色本体对基于颜色匹配的语义检索起着重要作用.为了实现汉语颜色知识的大范围共享与重用,本文结合语言学与本体理论构建汉语颜色词本体.通过本体的数学模型给出颜色词语义的规范说明,符合本体构建的"可扩展性"、"最小承诺"与"最小编码偏好"等原则.在建立相应的描述逻辑知识库TBox与OWL(Web Ontology Language,Web本体语言)本体的基础上,将汉语颜色词本体应用到供需语义匹配领域.实例表明,本文构建的颜色本体具有简单、实用的特点.同时,本文工作有利于各种Web应用有机结合来自语言学的汉语颜色知识.  相似文献   

8.
文章介绍了能自动在大量数据中找出问题答案的自动问答系统.具体介绍了自动问答系统的定义;分析自动问答系统的发展现状、自动问答系统的分类以及与传统信息检索的区别;重点研究了自动问答系统使用的技术;最后使用浅层句法分析、命名实体抽取、段落分割排序等技术设计了一个自动问答系统的实现模型.  相似文献   

9.
一种基于句法分析的情感标签抽取方法   总被引:1,自引:0,他引:1  
指出情感标签由评价对象和情感词组成,包含评论的关键要素,能清楚地表达评价者的观点意见。提出一种针对产品网络评论的情感标签抽取模型,利用依存句法分析设计情感标签抽取算法,通过情感极性计算对抽取出的情感标签进行过滤。通过放宽的抽取规则与情感极性过滤相结合,以提高情感标签的召回率,实现潜在评价对象的抽取。最后用网络抓取的产品评论语料作为测试数据集对模型进行测试,获得较高的抽取准确率和召回率,并对模型中存在的问题进行总结,作为模型改善的指导。  相似文献   

10.
一种面向中文信息检索的汉语自动分词方法   总被引:3,自引:1,他引:3  
阐述信息检索对汉语分词技术的要求,分析中文信息检索与汉语分词技术结合过程中有待解决的关键问题,并重点针对这些要求及关键问题提出一种面向中文信息检索的汉语自动分词方法。  相似文献   

11.
本文在分析用户网络浏览行为的基础上,从用户的专业知识经验出发设计了用以控制、引导网络蜘蛛行为的专家知识库,利用模糊规则推算法,在进行网页下载的同时对网页中的URL主题相关度进行预测的同时对相应的资源进行模糊规则分类.文章并以基础教育资源搜集为例对该算法进行了实现,通过对先后两个版本的系统性能的分析和比较,结果表明,使用模糊规则推理算法,进行URL相关度预测可以有效提高主题资源搜集的速度,采用二次分类的办法可以进一步提高资源分类的准确度,从而提高主题资源搜索系统的整体性能.  相似文献   

12.
为满足用户对留学人物地域信息进行查询、展示与分析的需求,提出基于Google Maps API实现GIS应用的解决方案和技术思路。利用Google Maps APIJ、avaScript、PHP、MySQL及相关技术将留学人物数据库与Google地图进行整合,构建留学名人足迹、留学人物分布等GIS应用,以增强数据库可用性并提升用户体验。  相似文献   

13.
基于反序词典的中文逆向最大匹配分词系统设计*   总被引:6,自引:0,他引:6  
介绍几种常见的分词算法,在改进传统的反序词典、优化逆向最大匹配算法的基础上,设计并实现基于逆向最大匹配的中文分词系统,试验证明速度和精度都有显著提高。  相似文献   

14.
以著者的四角号码为取号依据,设计编写“汉语著者号自动生成系统”,对该系统测试后发现,编目人员运用此系统可以快速、准确地生成符合成都大学图书馆要求的著者号。  相似文献   

15.
研究将XML文本检索方法应用于长文本环境,并以中文博硕士论文为数据集。对博硕士论文数据集的XML标引、索引、关键词检索和结构化检索分别进行设计和实现,构建一个基于XML的中文博硕士论文检索系统。  相似文献   

16.
中文全文检索系统H——QWJS的设计与实现   总被引:1,自引:0,他引:1  
叙述通用中文全文检索系统H-QWJS的总体设计思想,给出该软件系统的主要特点、功能模块、数据库组织。最后简要叙述系统的运行环境。  相似文献   

17.
基于汉字聚类特征的中文字符串相似度计算研究   总被引:1,自引:0,他引:1  
采用聚类分析的方法,对汉字的特征进行研究和分析,找出其内在规律,根据汉字具有“成簇性”的特点,对中文字符串进行精细化匹配,给出基于改进编辑距离的相似度计算模型。实验结果表明,该模型对中文字符串的相似度具有更为精细的体现。  相似文献   

18.
出具论文收录证明是高校图书馆信息咨询部的重要业务之一,其基本流程为客户提出申请,图书馆员检索引文数据库,从检索结果文件提取论文信息,生成报告等。其中最耗时的环节为从引文文件提取信息的蛮力过程,所耗时间和论文篇数呈线性增长。文章首先分析了开具检索证明的业务流程和业内研究现状,其次分析了检索结果文件,接着设计和开发了论文收录证明报告辅助系统,最后以系统在本校超过三年的使用效果说明:该系统极大地提高了出具收录证明的速度和信息咨询部的工作效率,是一套具有参考和推广价值的系统。  相似文献   

19.
通过对检索资源及用户检索提问的语义解析,采用基于概念图匹配的语句相似度计算方法,不仅可得到与检索条件精确匹配的信息资源,而且还能查询到与检索条件语义相关的隐含信息资源,提高信息查全率和查准率。最后,用一个语义检索实验系统验证系统分析与设计的可行性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号