首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
司莉  何依 《现代情报》2016,36(6):165-170
语料库是指根据一定的方法收集的自然出现语料构成的电子数据库。2000年以来我国对多语言语料库的研究呈现快速上升的趋势。在全面文献调研的基础上,本文对我国多语言语料库的研究现状进行了归纳与梳理。国内学者对多语言语料库的研究多集中于语言学领域,其次是计算机领域。研究主题主要分布在多语言语料库的关键技术研究、多语言语料库的应用研究两大方面。  相似文献   

2.
提出一种基于多Agent协作架构的自动分类知识库更新思路,通过多Agent协作新文档与已有训练规则的匹配,有效地进行新类别的自动扩展和新分类规则的自动生成,同时为训练集的频繁维护问题提出了新的解决方案。  相似文献   

3.
文章提出的基于三元组可比语料库的自动语言剖析技术扩大了该研究领域的内涵,使其包括面向自然语言处理的应用研究。从工程可实现性考虑,创新性地提出建造三元组可比语料库,利用n-元词串、关键词簇和语义多词表达等自动抽取技术,通过对比中式英语表达,发掘英语本族语言模型,实现改进和发展机器翻译、跨语言信息检索等自然语言处理应用的目标。  相似文献   

4.
基于SVM的企业竞争情报自动分类系统模型   总被引:1,自引:0,他引:1  
孙超  张玉峰 《情报杂志》2007,26(3):40-43
针对企业竞争情报的自动分类问题,介绍了基于支持向量机(SVM)方法的自动分类技术的原理,探讨了该技术在企业竞争情报分类系统中的应用,并结合多Agent思想构建了基于支持向量机的企业竞争情报分类系统模型,重点研究了竞争情报的自动分类方法。  相似文献   

5.
提出了一种图像分级分类方法。在该方法中,利用颜色数区分为照片和图画,利用Hough变换检测图像边缘,根据图像边缘中的直线比例区分人造物与自然物、图表与绘画,利用图像边缘的平均模糊度区分简笔画和工笔画。  相似文献   

6.
萧莉明  于宽  蔡珣 《现代情报》2007,27(4):146-147,150
本文设计了一个有效的基于贝叶斯分类器的中文期刊自动分类系统。首先,该系统以期刊的名称作为惟一的标引内容,并利用自动分词技术将期刊名称分成待分类的样本集;其次,通过对图书馆的样本数据进行训练建立的分类库,本文使用贝叶斯分类器实现中文期刊的自动分类。实验结果表明,该分类器对中文期刊的分类具有很好的高效性和准确性。  相似文献   

7.
在支持向量机和遗传算法的基础上,提出一种新的启发式多层文本分类算法。实验结果证明了该算法的可行性和有效性。文本分类技术是解决大规模文本处理的有效途径。  相似文献   

8.
孙建军  屈良 《情报科学》2012,(3):321-326,346
从链接动机入手,综合国内外学者们有关链接分类的研究,再结合图林博客网络自身的特点,总结出链接分类标准,并划分出了基于不同层次的链接类型,并以此构建了三级链接分类体系;利用层次分析方法确定体系中每个不同子类的不同权重,并对数据结果作出分析。  相似文献   

9.
将大量中英文对照的专利文本作为平行语料库,提出一种自动抽取中英文词典的方法.先利用外部语义资源维基百科构建种子双语词典,再通过计算点互信息获得中英文词对的候补,并设置阈值筛选出用于补充种子词典的词对.实验结果表明:对英语文档进行单词的短语化有助于提高自动抽取结果的综合性能;另一方面,虽然通过句对齐方式可以提高自动抽取结...  相似文献   

10.
介绍了一种常用的文件类型HTML文件的文本信息预处理方法,该方法能够快速提取网页文本。实验表明,该预处理方法具有较好的分类效果。  相似文献   

11.
一种基于词上下文向量的文本自动分类方法   总被引:1,自引:0,他引:1  
分析了传统文本自动分类方法的不足、词上下文向量的含义及其在自动分类中的作用,提出了一种基于词上下文向量的文本自动分类方法,该方法利用词上下文向量来生成分类器的类别中心向量和待分类文本的文本向量,使分类质量有所提高。  相似文献   

12.
本文在介绍交互式遗传算法的基础上,提出了基于交互式遗传算法网站信息分类体系交互设计的基本思路;并采用JSP实现了MVC模式下网站信息分类体系交互设计程序。  相似文献   

13.
在海量视频标签检索中,我们通过开发一个条件依赖网络模型。实现一个循环的指示图形模型,该模型提供了一个直观的代表性的多个标签依赖,和良好的高效的模型训练的综合智能框架,使用二元分类推断。该模型可以有效地利用标签的依赖,以提高多标签分类性能。  相似文献   

14.
尹桂秀 《情报理论与实践》2002,25(2):115-116,122
This article introduces a Chinese text automatic classification method, including its principle and classification process. The article focuses on some key theoretical problems, such as word classification, keyword collection and keyword matching.  相似文献   

15.
基于不同的分类算法针对特性迥异的语料数据进行分类,其分类效果往往不同。通过研究分类算法针对专门语料库与自建语料库分类效果各不相同的根本原因,提出一种提高分类性能的新途径。从不同语料库的自动分类对比入手,定义类别聚类密度、类别复杂度、类别清晰度三个指标对语料库信息进行度量,通过多因素方差分析考察三个指标与分类性能的关系,得出语料的各项指标对不同分类算法分类性能的影响关系,并提出一种基于类别清晰度的交叠类文本分类方法以验证指标的有效性。实验表明:该三个指标都在不同程度上影响着分类算法的分类性能。语料类别的聚类密度越高,复杂度越低,类别清晰度越高,其表现出的分类效果越好。  相似文献   

16.
遥感图像分类是遥感图像处理的一个重要内容,根据遥感图像监督分类方法适用范围不同且分类机制各有优劣的特点,将多分类器联合对遥感图像进行分类,结果表明,与单一分类器的分类结果相比,多分类器结合的监督分类技术能有效提高遥感图像专题信息提取的精度。  相似文献   

17.
一种基于不变矩的图像分类算法   总被引:1,自引:0,他引:1  
在图像分类和识别技术中,针对图像特征的提取这一重要问题,文章实现了用三种不变矩对图像目标提取特征并进行分类的方法,该方法分别提取目标的区域中心矩、区域中心不变矩和径向矩作为特征矢量,并与区域协特征方差算子进行图像分类比较分析。将特征用支持向量机的方法进行分类器的训练,再对目标进行分类。实验结果表明,区域径向矩算子运用在车辆目标分类中具有较好的效果。  相似文献   

18.
许慧 《科教文汇》2013,(18):97-97,101
一种多适性垃圾桶设计摒弃以往传统垃圾桶的形象,使垃圾桶具有更好的适应性,其设计理念来源于生活中一次性塑料购物袋的再次利用。通常我们生活中的废弃购物袋大小不一,垃圾桶确是有固定规格,无法满足各种袋子套置的要求,尤其是过小的袋子,人们想再次利用却有心无力,该方案的设计从改变垃圾桶的形态做起,上下多层的锯齿结构既可牢牢挂住袋子,又可适应不同的袋子,开口更大便于投放垃圾。  相似文献   

19.
讨论两类蠓虫的分类问题。利用极大化“间隔”的思想,将分类问题转化为一个二次规划及其对偶规划问题,即支持向量机算法。通过求解此数学规划,得到一线性分类函数。基于该算法,通过给定的蠓虫的样本集,建立上述分类模型,求得一个线性分类函数,为蠓虫的正确分类提供了一个较可靠的方法。  相似文献   

20.
许慧 《科教文汇》2013,(6):97+101
一种多适性垃圾桶设计摒弃以往传统垃圾桶的形象,使垃圾桶具有更好的适应性,其设计理念来源于生活中一次性塑料购物袋的再次利用。通常我们生活中的废弃购物袋大小不一,垃圾桶确是有固定规格,无法满足各种袋子套置的要求,尤其是过小的袋子,人们想再次利用却有心无力,该方案的设计从改变垃圾桶的形态做起,上下多层的锯齿结构既可牢牢挂住袋子,又可适应不同的袋子,开口更大便于投放垃圾。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号