期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

汉语自动分词研究展望 总被引：13，自引：1，他引：13

文庭孝邱均平侯经川《现代图书情报技术》2004,20(7):6-10

汉语自动分词是计算机中文信息处理中的难题。本文通过对现有分词方法的分析，指出了今后汉语自动分词研究的三个发展方向，即对传统文本的有效切分，计算机技术的快速发展，改造书面汉语书写规则。相似文献

2.

汉语自动分词研究进展 总被引：11，自引：0，他引：11

文庭孝《图书与情报》2005,(5):54-63

汉语自动分词是计算机中文信息处理中的难题，文章通过对现有自动分词方法研究进展的分析。指出了今后汉语自动分词研究的三个发展方向，即对传统文本的有效切分，计算机技术的快速发展，改造书面汉语书写规则。相似文献

3.

汉语自动分词研究的发展趋势

刘晓英《高校图书馆工作》2005,25(4):25-28

汉语自动分词是计算机中文信息处理中的难题。文章通过对现有分词方法的探讨，指出了汉语自动分词研究未来的发展趋势，即传统文本的有效切分，计算机技术的快速发展，改造书面汉语书写规则。参考文献35。相似文献

4.

基于EM算法的汉语自动分词方法 总被引：9，自引：1，他引：8

李家福张亚非《情报学报》2002,21(3):269-272

汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。相似文献

5.

汉语分词技术综述 总被引：2，自引：1，他引：1

熊回香夏立新《图书情报工作》2008,52(4):81-81

首先介绍了汉语自动分词技术及基于词索引的中文全文检索技术,接着分别从文献自动标引、文摘自动生成、文本自动分类、文本信息过滤、自然语言检索接口和智能检索等方面详细地阐述了汉语自动分词技术在中文全文检索中的应用,并对目前汉语自动分词技术存在的局限性进行了分析,提出了发展思路,最后对汉语自动分词技术在中文全文检索中的应用前景进行了预测。相似文献

6.

基于两字词簇的汉语快速自动分词算法 总被引：10，自引：1，他引：9

郭祥昊《情报学报》1998,(5):1

本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占７５％的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现相似文献

7.

全文检索中的汉语自动分词及其歧义处理 总被引：3，自引：0，他引：3

熊回香《中国图书馆学报》2005,31(5)

歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。相似文献

8.

汉语自动分词与内容分析法研究 总被引：9，自引：0，他引：9

邱均平文庭孝周黎明《情报学报》2005,24(3):309-317

汉语自动分词是计算机中文信息处理中的难题,也是文献内容分析中必须解决的关键问题之一。本文通过对已有自动分词方法及其应用研究的分析,指出了今后汉语自动分词研究的三个发展方向:克服汉语文本切分中的困难,继续研究传统文本切分的有效方法;将人工智能技术与汉语自动分词技术有机结合起来;改造汉语文本书写规则使之利于计算机切分。并分析了汉语自动分词和内容分析法之间的密切关系,以及汉语自动分词对内容分析法的影响相似文献

9.

汉语自动分词研究的现状与新思维 总被引：17，自引：2，他引：15

程小澜泮杏梅《现代图书情报技术》1998,14(4):22-26

汉语自动分词是机器翻译、文献标引、智能检索、自然语言理解与处理的基础。本文对十余年来的汉语自动分词的研究方法与成果进行了综合论述, 分析了现有分词方法的特点, 提出了把神经网络和专家系统结合起来建立集成式汉语自动分词系统的新思维。相似文献

10.

基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验 总被引：9，自引：0，他引：9

查贵庭侯汉清《情报学报》2002,21(3):273-277

避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。相似文献

11.

基于神经网络的汉语自动分词系统的设计与分析 总被引：15，自引：1，他引：14

尹锋《情报学报》1998,17(1)

应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。相似文献

12.

基于既定词表的自适应汉语分词技术研究 总被引：3，自引：0，他引：3

黄水清程冲《现代图书情报技术》2006,1(5):13-17

提出一种汉语分词算法，在给定的分词词表的基础上进行汉语分词时，不但能成功切分出分词词表中已有的词，而且能同时自动识别出分词词表中没有的词，即未登录词。与逆向最长匹配法以及其他未登录词识别算法进行的测试比较表明，该分词算法可以有效地解决大多数未登录词的识别问题，并且能减少分词错误，同时对分词算法的效率基本没有影响。相似文献

13.

基于知识评价的快速汉语自动分词系统

张民李生王海峰赵铁军王铁志《情报学报》1996,(2)

汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个，一个是切分的速度，一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法，可大大提高系统的切分速度，而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后，本文对消歧提出了一些设想。相似文献

14.

基于《〈知网〉》词汇语义相关度计算的消歧方法

李生琦田巧燕汤承《情报学报》2009,28(5)

歧义字段的处理是汉语自动分词系统中重要而困难的问题之一.歧义处理正确率的高低直接影响着分词的质量.为了解决汉语自动分词系统中的歧义问题,本文基于<知网>的义原关系,在分析了影响词语语义相关度的主要因素后,引入相关度计算,利用<知网>中义原之间的纵向和横向关系及实例因素计算出不同词性的相关度,根据相似度的对称性计算实例的影响因素,由此来提高语义相关度的准确率,同时针对所提出的方法给出了实例验证.实验结果表明,该方法计算得到的语义相关度结果更加合理,为消除汉语自动分词中的歧义问题提供了良好的支撑依据,也使得汉语自动分词系统处理歧义字段更有效. 相似文献

15.

情报检索数学模型及若干技术进展*

徐进鸿邵品洪李明霞《现代图书情报技术》1990,6(3):5-10

本文探讨了情报检索数学模型的研究进展以及汉语文献自动分词和信息压缩存储的若干方法。相似文献

16.

面向未登录领域词切分的中文分词技术研究

蔡荣彦《信息系统工程》2013,(11):133-136

本文通过研究现有中文分词技术的理论和工具,提出一种面向未登录领域词识别的中文自动分词算法。首先,利用已有的中文自然语言处理技术对中文文本进行自动分词,并用一种改良的串频统计方法自动识别出语料中的未登录领域词汇,从而有效提高了中文分词的准确性。相似文献

17.

汉语自动分词模式自动机构造研究 总被引：1，自引：2，他引：1

吴绍根《现代图书情报技术》2006,1(5):47-49

基于有限状态自动机，提出一种新型的有限自动机模型--模式自动机，并以该模型为基础，设计出一种新的汉语自动分词模型，给出构造汉语自动分词模型的核心数据结构和构造算法，并分析该分词算法的复杂度。相似文献

18.

一种面向中文信息检索的汉语自动分词方法 总被引：3，自引：1，他引：3

孙巍《现代图书情报技术》2006,1(7):33-36

阐述信息检索对汉语分词技术的要求，分析中文信息检索与汉语分词技术结合过程中有待解决的关键问题，并重点针对这些要求及关键问题提出一种面向中文信息检索的汉语自动分词方法。相似文献

19.

基于词索引的中文全文检索关键技术及其发展方向 总被引：2，自引：0，他引：2

下载免费PDF全文

熊回香夏立新《中国图书馆学报》2007,33(4)

基于词索引的中文全文检索的研究是一个涉及到多个领域的综合性课题。汉语自动分词的精度和速度、词索引数据库的结构、词汇控制技术、检索匹配机制等是影响中文全文检索效果的关键因素。目前基于词索引的中文全文检索技术还在分词技术、网络信息标引的准确率、查全率、查准率以及查询方式上存在局限。未来的中文全文检索将最终在语义、语用、语境层次上实现智能化的信息检索。相似文献

20.

全二分快速自动分词算法构建 总被引：1，自引：0，他引：1

张海营《现代图书情报技术》2007,2(4):52-55

分析现有分词算法存在的不足，在此基础上提出一种新的分词词典，通过为分词词典建立首字Hash表和词索引表两级索引，使得该分词词典支持全二分最大匹配分词算法，利用该分词算法进行自动分词，其时间复杂度实现了大的改善。相似文献