首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
郑凤萍 《现代情报》2007,27(3):143-144
文本提出了一种基于模糊向量空间模型和径向基函数网络的分类方法。该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。  相似文献   

2.
基于模糊向量空间的文本分类方法   总被引:1,自引:0,他引:1  
郑凤萍  刘春雨 《情报科学》2007,25(4):588-591
本文针对文本自动分类问题,提出了一种基于模糊向量空间模型和径向基函数网络的分类方法。网络由输入层、隐层和输出层组成。输入层完成分类样本的输入,隐层提取输入样本所隐含的模式特征,将分类结果在输出层表现出来。该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。  相似文献   

3.
Web信息复杂程度不断加深,多维度、高复杂度的信息越来越多,信息中的错误信息特征在海量复杂数据属性中表述越来越困难,造成信息挖掘耗时过长,挖掘效果不好的问题。为了解决这一问题,提出了一种距离信息模糊信息权值分类的Web错误数据挖掘算法。在Web特征表述过程中,运用距离描述Web数据的错误数据特征,运用模糊信息熵,对错误数据特征进行距离分类,保证数据分类的准确性,最大程度的完成错误数据高效挖掘。实验结果表明,该算法能有效减少错误数据信息在海量信息中的挖掘时间,提高了挖掘的准确性,取得了满意的效果。  相似文献   

4.
基于改进VSM的Web文本分类方法   总被引:2,自引:0,他引:2  
Web文本自动分类技术是Web文本挖掘的关键技术之一.针对Web文档中不同标签中的文本具有不同的表达文档内容的能力,提出了改进的特征项加权计算方法.根据特征项在文档中的位置和出现频率计算其权值,并给出了具体的Web文本分类算法和评测方法.经实验验证,改进后系统的微平均查准率均大于0.8,分类性能明显好于改进前.  相似文献   

5.
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法.该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法.基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量.考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序.实例验证了该方法的有效性.  相似文献   

6.
提出了一种基于机器学习的Web文本自动分类的架构,提出了中文Web文档自动分类的主要技术问题。介绍了中文Web文档自动分类工具的总体设计,它主要包括网络蜘蛛、中文分词、特征选取和贝叶斯分类器等功能模块。最后对中文Web文档自动分类器进行了实验。  相似文献   

7.
Web网络中存在海量文本,需要进行合理高效的文本抽取,实现Web文本数据挖掘。由于Web文本数据的高维特性,文本抽取过程中自动分类配对困难。提出一种基于RBF神经网络隐节点共振致密配对的Web数据文本抽取算法,进行Web数据文本特征采样与关联主特征挖掘,在每次移动中形成RBF隐节点共振致密配对,得到最优文本特征选择的路径,建立RBF神经网络分类器,实现基于蚁群算法的特征抽取算法改进。实验结果表明,该算法能有效实现对隐节点的共振致密配对,特征挖掘跟踪性能较好,保障了挖掘性能,系统所提取的特征分量与其他模糊分量差距较小,文本正确抽取召回率高于传统方法,在Web网络数据文本抽取中具有优越可靠的应用价值。  相似文献   

8.
基于TM遥感影像的玉米地专题信息自动提取   总被引:1,自引:1,他引:1  
TM遥感影像中专题信息的自动提取是目前遥感界的研究热点,也已成为遥感信息生产流程中的瓶颈环节。本文分析了耕地专题信息自动提取的研究现状,选取了吉林中部和辽宁省东北部作为研究区,采用监督分类的方法对研究区TM遥感影像进行分类,提取了玉米地专题信息,玉米地信息的提取精度为85.5%。根据遥感影像目视解译的原理,提出了基于多特征空间的遥感影像专题信息自动提取的研究方法,通过对多特征空间的数学描述和计算机处理实现 遥感专题信息的自动提取。采用多特征空间的方法将玉米地信息分为光谱特征空间、形状特征空间、区域地学特征空间和干扰特征空间,应用ERDAS8.5遥感图像处理软件中的knowledge engineer模块的开发功能,设计了基于多特征空间的玉米地专题信息自动提取的专家库,使用专家库对玉米地信息进行了自动提取,提取精度为92.9%。从基于多特征空间的分类结果与监督分类结果的比较发现,基于多特征空间的自动提取方法可以提高专题信息的提取效率,对未来实现遥感影像的智能解译是一种研究方法的探索。  相似文献   

9.
涂波  王忠民 《情报杂志》2005,24(3):48-49
随着Web信息的急剧膨胀 ,它需要高效的信息采集工具来完成信息资源的采集。智能化Web信息采集系统能够对Web信息进行自动采集、分类 ,并对信息搜索和浏览提供必要的支持。  相似文献   

10.
庞景安 《情报科学》2007,25(8):1171-1175
本文在研究Web小世界特征以及形成小世界网络机制的基础上,着重分析了运用网络计量学理论,对Web网站和网页之间存在的小世界特征进行深入研究的技术和方法,并分析比较了研究结果.同时,探讨了Web小世界特征在网络信息环境中的具体应用.  相似文献   

11.
基于利用视角的土地资源分类方法探讨   总被引:1,自引:0,他引:1  
杨子生  杨诗琴  杨人懿  王佳  吴秋菊 《资源科学》2021,43(11):2173-2191
科学、合理、可行的土地资源分类是切实有效地开展土地资源调查、正确地制定土地资源开发利用与整治规划方案、以及科学地管理土地资源的前提和基础。本文在界定土地资源分类概念和内涵的基础上,对国外6套代表性的土地资源分类体系和国内已有的8套全国性土地分类系统进行了比较与评析,分析了中国现行土地资源分类体系中存在的主要问题,进而提出了完善中国土地资源分类体系的建议。结果发现:中国现行土地资源分类体系存在的主要问题有三,一是分类层次少,基本上只有2个层次,类型数不足,难以准确反映全国复杂多样的土地利用类型和土地利用地域分异规律,实际应用成效受损;二是分类标准混乱,同一层次存在形式分类标准和功能分类标准并存的现象,科学性和逻辑严密性不足;三是有些地类的分类标准不明确,使部分地类没有了归属,造成无类可分,与用地分类设置“不重不漏”的原则相悖。为此,提出了完善中国土地资源分类体系的相关建议,一是未来的土地资源分类体系修订须要切实坚持地类划分的6条基本原则;二是可以借鉴英美等国较成熟的4个层次分类经验,并具体提出了四级制的中国土地资源分类系统基本框架;三是认为可以参考俄罗斯的经验,将全国土地分类标准体系上升为国家法律法规,全面提升全国土地资源分类体系的严肃性与权威性。  相似文献   

12.
作为一种工业产权的外观专利在产业振兴中起着重要作用.外观专利采用的洛迦诺分类标准不支持图像分类,而AI算法直接在洛迦诺分类标准图像数据集并不能有效提升分类精度.因此,对外观专利审查员来说,外观专利的分类检索具有相当大的挑战.为此,本文提出先领域、再功能、后视觉的四级外观专利图像分类新标准,在此分类标准基础上构建了Pat...  相似文献   

13.
对澜沧江流域山区典型试验样区遥感数据运用AHP递阶层次结构,将土地覆盖类别分成若干层次。结合特征选取与采用多种分类算法组合,先进行类间易于区别的大类别的分类信息提取处理,得到一层次的分类结果,再基此对各分类结果探索进一步的分类处理,获得第二层次的分类结果。如此进行,直至分出所有确定类别。试验结果表明,该分类组织较之传统基于一次特征选取所进行的单级分类技术组织实施,具有构思科学合理,操作简单可行。监测结果评价精度可满足澜沧江流域综合开发,达到获取反映山地生态主要覆盖类别的遥感监测技术要求。  相似文献   

14.
本文在对产品全生命周期质量信息进行调研的基础上,采用面分类法和线分类法相结合的方式对质量信息进行了分类,得到质量信息分类体系,在此基础上对质量信息进行编码,并开发了相应的计算机辅助分类编码系统,有效地解决了机械制造企业信息化过程中质量信息的交流与共享问题。  相似文献   

15.
基于生态保护对土地利用分类系统未利用地的探讨   总被引:6,自引:1,他引:6  
我国现行土地利用分类体系是从2001年开始施行的,是对以往各分类体系的继承与发展。随着社会经济的发展,土地利用中的生态环境问题日益突出,许多“未被利用”的土地资源越来越成为地球生态系统的重要组成部分。但是,在当前可持续发展理念下,我国现行土地利用分类体系对于“未利用地”及其子系统中各级地类的命名与内涵的理解极有可能会给“未被利用”土地的管理和利用带来负面影响。针对这一问题,本文在简述国内土地利用分类体系的演变过程并借鉴、吸收国外发达国家和地区及国内土地覆被/利用分类体系精华的基础上,对“未利用地”从利用的广义内涵与生态环境的重要性两个方面进行了辨析,探讨了“未被利用”土地资源的价值问题及其可持续利用问题。并且,在此基础上针对“未利用地”子系统,提出了基于生态保护的新的分类子系统,希冀能对现行土地利用分类方案中“未利用地”子系统的修改完善有所裨益。  相似文献   

16.
Automatic text classification is the task of organizing documents into pre-determined classes, generally using machine learning algorithms. Generally speaking, it is one of the most important methods to organize and make use of the gigantic amounts of information that exist in unstructured textual format. Text classification is a widely studied research area of language processing and text mining. In traditional text classification, a document is represented as a bag of words where the words in other words terms are cut from their finer context i.e. their location in a sentence or in a document. Only the broader context of document is used with some type of term frequency information in the vector space. Consequently, semantics of words that can be inferred from the finer context of its location in a sentence and its relations with neighboring words are usually ignored. However, meaning of words, semantic connections between words, documents and even classes are obviously important since methods that capture semantics generally reach better classification performances. Several surveys have been published to analyze diverse approaches for the traditional text classification methods. Most of these surveys cover application of different semantic term relatedness methods in text classification up to a certain degree. However, they do not specifically target semantic text classification algorithms and their advantages over the traditional text classification. In order to fill this gap, we undertake a comprehensive discussion of semantic text classification vs. traditional text classification. This survey explores the past and recent advancements in semantic text classification and attempts to organize existing approaches under five fundamental categories; domain knowledge-based approaches, corpus-based approaches, deep learning based approaches, word/character sequence enhanced approaches and linguistic enriched approaches. Furthermore, this survey highlights the advantages of semantic text classification algorithms over the traditional text classification algorithms.  相似文献   

17.
面向对象的遥感影像分类方法克服了传统基于像元分类方法的弊端,将对象光谱、空间纹理等特征一并加入分类依据中,有效避免了“同谱异物”或“异物同谱”的问题,适合于高分辨率的遥感影像分类。以武汉市某街区公共遥感影像为例,采用上述方法,结合支持向量机分类方法进行地物分类识别,结果显示,分类总体精度达到了89.9913%,取得了良好的分类效果。  相似文献   

18.
温晓春 《科教文汇》2020,(4):191-192
垃圾分类教育作为全民教育的重要内容,也是职业教育的重要组成部分,垃圾分类的基础性建设在于普及垃圾分类教育,将“互联网+”的理念技术运用于垃圾分类教育中,不仅可以提升教育效果,还可以提升教学效率。本文从“互联网+”背景下垃圾分类教育的现状出发,在探究垃圾分类教育当前存在问题的基础上提出一些运用“互联网+”进行垃圾分类的教育手段,以提升公民的垃圾分类意识,达到广泛宣传垃圾分类的目的。  相似文献   

19.
省级农用地分等的质量控制方法研究   总被引:5,自引:1,他引:5  
与县级农用地分等相比,省级农用地分等具有以下特点:县与县之间的等别要有可比性、行政区域边界等别要协调(能接边)、多层次,即一次工作可同时完成省、市、县三级成果、数据管理难度大等.因此在以省为单位进行农用地分等时,如何保证分等成果的质量成了关键技术问题.河南省采用过程控制和多途径结果检验相结合,对农用地分等质量进行控制.过程监控是指从工作底图标准化开始,到基础数据的调查整理与录入、分等参数选择、指数计算等,都要保证工作过程的每一个环节科学、准确;多种途径对成果进行检验包括宏观规律分析、微观差异分析、分等指数的统计分析、等别收益验证、与以往成果对比分析、实地验证等,多方面检验成果是否合理、是否符合实际.河南省农用地分等实践证明,过程控制和多途径结果检验相结合的质量控制方法,在保证分等结果科学性与合理性(符合实际)基础上,又保证了县级分等成果精度,符合技术<规程>的要求、解决了行政区域边界接边的困难、省域内分等成果的可比,而且省时、省力.  相似文献   

20.
景观分类既是景观结构与功能研究的基础,又是开展景观评价、规划与设计的前提条件,是景观生态学理论与实践相结合的桥梁和纽带.但是,目前国内外对景观分类理论和方法的研究还不够,对乡村景观分类的详细探讨更是不足.本文在借鉴国内外景观分类理论和方法的基础上,针对乡村景观规划的要求和我国乡村景观的特点,提出了一种乡村尺度的景观功能形态分类方法,即采用景观区、景观类、景观亚类和景观单元四级分类体系.在此基础上,以地貌类型和土地利用方式比较典型的北京市海淀区白家疃村为实例进行了详细的景观类型划分,共划分了1个景观区、3个景观类、9个景观亚类和28个景观单元,并借助于GIS,进一步编制了白家疃村景观分类图.结果表明,该方法能够反映实际存在的各种景观类型,充分考虑到了影响乡村景观类型的自然因素和人为因素,能够满足大比例尺的乡村景观制图和乡村景观规划的需要,体现了乡村景观的特点,是一种比较综合的实用性方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号