期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

提出一种基于近邻匹配新的分词算法Jlppeccz,该算法首先把一篇文章以标点符号为界线分成若干个句子,然后用近邻匹配方法把一句话切分成1～4字的词,通过对词库的搜索,对已分的词进行重组,把小词合并成大词,再将处理过的词存储到一个临时的词库里,以备后续的句子查找,并可实现对词库添加词的功能.与经典MM算法和词频统计方法相比,本文算法有较大的改进. 相似文献

8.

短中文分词算法优化研究

童小光郭超康洪晶《教育技术导刊》2017,16(5):42-43

对中文分词进行研究是自然语言处理的重要步骤,结合字典对短中文进行正逆向分词,在此基础上得到多组分词结果,利用基于统计的方法和基于规则的方法进一步优化算法,根据用户使用频度和网络搜索热度以及词语间的固定搭配规则对多组分词进行排序,并通过实例验证发现该方法具有较好分词效果。相似文献

9.

关于中文分词问题数据结构模型的讨论

张青李大农《黄冈师范学院学报》2013,(6):72-76

在分词工作常用数据结构模型的基础上,提出了字符串完全分词网络模型,讨论了该模型的基本性质,给出了其中的路径查找基本算法。该模型能反映中文分词问题自身的特点,便于分析分词问题中的统一性质。利用该模型将全切分图的生成、修改、路径查找等工作分解为统一平台上相对独立的过程,能较好地配合多种常用分词算法,简化对各种算法的研究和描述。该模型与自然语言理解后续工作使用的数据结构如句法树等也有很好的相似性。相似文献

10.

基于JAVA的小型中文分词系统

宋哲伦《教育教学论坛》2013,(24)

互联网信息飞速增长,网络资源不断增加,于是搜索引擎应运而生,它的出现为我们在网络上搜集我们所需要的资源提供了很大的方便,但是人们并不满足于早期的搜索引擎的功能和速度,于是搜索引擎开始不断地被更新和完善,而分词对于搜索引擎的更新和完善起着很重要的作用。分词作为搜索引擎的重要组成部分,对搜索引擎的查找正确率以及查找速度具有很大的影响。它将用户输入的语句分割成一个个词语和单字,这样检索程序就能很容易地理解用户所需要的信息,从而为用户返回正确且有价值的信息资料。本文通过对正向最大匹配、逆向最大匹配等分词算法以及词典的整词二分、TRIE索引树、逐字二分和双哈希构造方法进行理论分析,了解各种分词算法和词典构造方法的优点和缺点,并用Java编程实现正向最大匹配、逆向最大匹配的分词算法以及一维线性表、首字哈希、双哈希三种词典构造方法,最终整合实现了Java分词系统。相似文献

11.

基于中文分词算法的英语学习资源查询系统研究

卢保娟《教育教学论坛》2014,(38):157-158

针对人工智能在信息搜索领域的实际应用,本文介绍了一种基于中文分词算法的英语学习资源查询系统。该系统通过一种基于中文分词算法的搜索策略,结合事例推理技术实现对英语学习资源的智能搜索。系统测试结果表明,用户可以通过该系统搜索到所提问问题的类似事例以及解决该问题的相关知识条款。相似文献

12.

最大匹配算法在校园网信息提取中的应用

《洛阳师范学院学报》2015,(8):82-85

校园师生通过校园网进行有效的校内外信息搜索,中文分词起到举足轻重的作用.本文通过对中文分词方法的介绍,重点分析了最大匹配算法的优缺点,提出重组正向与逆向相结合的最大匹配算法思路,在校试验中取得了较好的效果. 相似文献

13.

基于自学习机制汉语自动分词系统研究

邓曙光刘金铸曾朝晖《平原大学学报》2006,23(1):87-89

为扩展分词知识库,提高自动分词能力,本文提出了一种基于自学习机制的汉语自动分词系统。该系统通过对逐词匹配法进行改进,结合分词规则来实现自动分词,并采用统计提取等自学习机制来完善和丰富分词知识库。模拟结果表明该系统能有效获取知识,获得较高的字段切分正确率。相似文献

14.

中文分词改进算法在物理教学中的应用

李畅吴振强《考试周刊》2011,(26):177-179

传统的算法处理分词过于粗糙,而且往往会引起分词歧义。为弥补传统分词算法的固有缺点,本文在吸收了成熟算法优点的基础上,提出了改良型的中文分词算法（正向扩词分词算法和反向扩词分词算法）。这两种新算法与传统最大匹配算法相结合,不但提高了分词的精度和速度,而且降低了分词服务程序的开发难度。经过实践验证,分词准确率达到大多数系统对中文分词的要求。相似文献

15.

多种方法融合的中文自动分词系统的设计与实现

郑炜冬《韩山师范学院学报》2009,30(6)

在分析现有几种中文自动分词算法的优劣且能实现优势互补的基础上,提出一种多种方法融合的中文自动分词算法.利用Visual-Prolog开发基于该算法的自动分词系统,并探讨了开发过程的关键技术.实验表明,采用所述算法和技术的自动分词系统的准确率较高、分词速度较快. 相似文献

16.

基于神经网络的中文分词技术研究

张艳梅胡文淑曾鍚《教育技术导刊》2007,(23)

基于神经网络的人工智能分词是中文分词技术的一个重要发展方向。介绍了当前神经网络分词的研究现状,给出神经网络分词的一般模型,重点阐述BP等算法在歧义解决中的应用,介绍了BP算法在未登录词识别方面的应用,最后对分词技术的发展进行了展望。相似文献

17.

有词典中文分词算法研究 总被引：2，自引：0，他引：2

李跃民王浩赵生慧《滁州学院学报》2008,10(3)

如何从大量文本中切分出有意义的词是人工智能研究内容之一.智能教学辅助系统主要是针对知识点的教学,而知识点也是一个个词.根据试题、课件、教材中的知识点,建立了一个知识点词典,提出了一个有词典的知识点发现算法,能够自动地从中文试题、课件和教材中找出相关知识点,帮助学习者巩固相关知识.算法分析和实验证明,针对专门的智能辅助教学系统,算法降低了查询匹配时间,提高了知识点的召回率、精确率. 相似文献

18.

有词典中文分词算法研究

李跃民 ;王浩 ;赵生慧《滁州师专学报》2008,(3):22-25

如何从大量文本中切分出有意义的词是人工智能研究内容之一.智能教学辅助系统主要是针对知识点的教学,而知识点也是一个个词.根据试题、课件、教材中的知识点,建立了一个知识点词典,提出了一个有词典的知识点发现算法,能够自动地从中文试题、课件和教材中找出相关知识点,帮助学习者巩固相关知识.算法分析和实验证明,针对专门的智能辅助教学系统,算法降低了查询匹配时间,提高了知识点的召回率、精确率. 相似文献

19.

中文分词技术综述 总被引：2，自引：0，他引：2

周宏宇张政《安阳师范学院学报》2010,(2):54-56

中文分词是中文信息处理的基础,分词系统也是中文信息处理中的一个主要组成部分,对中文文本的分词处理目前已经应用到了中文自然语言理解、文献检索、搜索引擎以及文本挖掘系统等领域。本文对现有的中文分词技术进行了综述,分析了现有分词方法的技术特点,指出了部分分词方法存在的优缺点。相似文献

20.

自动分词在输入法测试系统中的应用

高洁羽吕强杨季文钱培德《电化教育研究》2003,(2)

自动分词是中文信息处理的基本工作 ,在诸多重要领域如篇章理解、机器翻译、文本检索、文本的语音输入输出、文本校对、自动标引等领域都得到广泛的应用。本文介绍了在输入法测试系统中的自动分词的应用 ,提出了必须采用适当的分词方法配合应用系统需求的思路相似文献