共查询到20条相似文献,搜索用时 15 毫秒
1.
数据分析整合方式可以提升数据库的泛化能力和分析准确度,被普遍重视.当前数据分析整合方式已被广泛应用在图片信息处理、生物信息学和电脑视觉等应用领域.当前常使用的集成化教学方式,通过多种基分类器进行机器学习,同时采用一种整合方式把多种基分类器的所学成果整合到一起,由于信息量的逐步扩大,数据库整合问题也日益复杂化,很难提高整... 相似文献
2.
近年来,心血管疾病已成为威胁人们生命的主要疾病,而心血管疾病患者早期发病时往往出现心律失常症状,因此早期检测心律失常对提前预防心血管疾病,及早介入治疗具有至关重要的意义。基于此,本研究利用小波分析方法对不同类型的心电序列进行去噪声处理,再利用ARMA模型以及时间序列的方法对分解后的信号序列进行特征提取,将ARMA模型的系数作为心电信号的特征指标;结合决策树分类、支持向量机分类和随机森林分类机器学习方法对提取后的心电特征指标进行分类研究,并根据实验结果对三种算法的性能进行比较分析。 相似文献
3.
[研究目的]面对海量的专利数据,如何构建有效的专利可转让性评估方法,筛选出具有转让可能性的专利,对于发现潜在高价值专利、提升我国专利成果转移转化效率具有重要意义。为此,提出一种基于机器学习的专利可转让性评估方法。[研究方法]首先利用基于机器学习的指标约减算法对从技术维度、法律维度、经济维度和主体维度构建的专利可转让性评估指标进行约减,以去除掉冗余指标;然后根据约减后得到的评价指标构建机器学习模型,并对专利可转让性进行评估。[研究结论]人工智能领域专利可转让性评估案例结果表明,当剔除掉冗余指标后机器学习模型的预测准确率均值提升了0.56%;基于机器学习的专利可转让性评估模型的分类准确率达到72.36%,可以较好地对专利的可转让性进行评估。案例结果验证了所提出方法的可行性和有效性,该方法为专利可转让性评估提供了新的研究方法。 相似文献
4.
5.
提出了一种图像分级分类方法。在该方法中,利用颜色数区分为照片和图画,利用Hough变换检测图像边缘,根据图像边缘中的直线比例区分人造物与自然物、图表与绘画,利用图像边缘的平均模糊度区分简笔画和工笔画。 相似文献
6.
常用的网页分类技术大多基于普通文本分类方法,没有充分考虑到网页分类的特殊性——网页本身的半结构化特征以及网页中存在大量干扰分类的噪音信息,同时多数网页分类的测试集和训练集来源于同一个样本集而忽视了测试集中可能包含无类别样本的可能。基于向量空间模型,将样本集看成由有类别样本和无类别样本两部分组成,同时选择了样本集来自于相同的网站,在去除网页噪音基础上结合文本相似度算法和最优截尾法,提出了一种基于不完整数据集的网页分类技术LUD(Learning by Unlabeled Data)来改善分类效果,提高分类精度。实验证明:LUD算法与传统的分类方法相比较而言,不但可以提高已有类别样本的分类精度,更主要的是提供了一种发现新类别样本的方法。 相似文献
7.
提出了一种基于机器学习的Web文本自动分类的架构,提出了中文Web文档自动分类的主要技术问题。介绍了中文Web文档自动分类工具的总体设计,它主要包括网络蜘蛛、中文分词、特征选取和贝叶斯分类器等功能模块。最后对中文Web文档自动分类器进行了实验。 相似文献
8.
卡尔曼滤波因具有计算量小,编程简单易于实现的优点,被广泛的用于通信和导航领域。但卡尔曼滤波在一些特定场景下,仍然存在一定的不足;例如在数据量较大的情况下,无法很好的对数据进行处理,容易产生发散的现象。为解决这样的问题,论文提出一种新的自适应卡尔曼滤波,能够有效改善此类问题。 相似文献
9.
研究前沿是科技创新过程中最具潜力和前瞻性的研究方向,尽早识别研究前沿对科学研究、企业研发资源优化配置、政府创新战略前瞻部署等至关重要。针对目前在研究前沿识别研究中存在的不足,提出一种基于机器学习的研究前沿识别方法。该方法首先通过构建机器学习模型来识别出潜在高被引论文,解决利用引文分析法来识别研究前沿的时滞性问题,并将潜在高被引论文纳入研究前沿识别的高被引论文核心文档集中;其次,以高被引论文核心文档集为数据源,利用聚类分析法识别出研究前沿主题,并对研究前沿主题进行对比和评价分析,进而识别出研究前沿;最后,以太阳能光伏电池研究领域为例进行了实证研究,验证了该方法的可行性和有效性,为研究前沿识别提供了新的研究方法。 相似文献
10.
介绍了Oracle的应用程序接口OCI,分析了SQL的执行过程。针对常规数据存储方法在海量数据存储和系统并发用户较多时效率低下的问题,定义一种简洁的数据结构,创建存储过程并完成对SQL信息的压缩。对比优化前后的实验数据,可以发现此方法能显著提高Oracle的数据存储效率。 相似文献
11.
本文阐述了一种基于特征词聚类的降维方式,其主要思想就是把词在文本中的出现看成一个事件,先通过搜索算法计算每一个特征词的分布,合并对分类有相似作用的特征词,从而起到了特征降维的作用。最后通过实验测试分析,提出了一种改进的、考虑全局簇信息的相似度计算公式,将其应用到文本分类中,实验表明提高了文本分类的精度。 相似文献
12.
13.
杨玉辉 《科学技术与辩证法》2006,23(5):14-17
自然科学的分类问题是自然科学研究和研究决策中的一个重要问题。现有自然科学分类方法存在学科概括不全、不能说明学科之间的内在联系等一系列问题。文章提出了一种新的自然科学的五类划分法,即把全部自然科学划分为物质科学、信息科学、生命科学、意识科学和人体科学五种基本类型。五类划分法不仅概括了自然科学的全部类型,而且还反映了各学科之间由低级到高级、由简单到复杂的内在联系。 相似文献
14.
利用高光谱遥感数据进行农作物分类方法研究… 总被引:3,自引:0,他引:3
本文以北京顺义区为研究区,研究、探讨利用高光谱遥感数据,通过逐级分层分类方法进行农作物信息提取与挖掘的基本思路和步骤。该方法面向应用目标,将复杂的信息提取过程分为相对简单的子过程,每个子过程根据拟提取的目标不同而选择不同特征参数和信息提取方法,从而实现有效地利用高光谱数据丰富的信息,提高了信息提取的精度目的。 相似文献
15.
在大数据时代背景之下,数据的分类和集成已经成为一种趋势,工业传感网也不例外。然而工业传感网数据有着数据量庞大,数据内容丰富的特点,对其进行人工分类费时费力。因此如何对工业传感网数据进行智能分类是工业领域中非常重要的一个模块。本文针对工业传感网数据的特性,在原有朴素贝叶斯算法(NB)的基础上,引入特有属性和公有属性的概念,并对两类属性赋予不同的权重,提出了一种基于特有公有属性的朴素贝叶斯(S-P-PNB)改进算法,并且用能够代表工业传感网数据的不同家电测试数据来进行实验。通过多次实验表明,该算法的改进能够有效提高不同家电测试数据的分类正确率,为其后续的数据集成做了铺垫,也为工业传感网数据分类提供了一种新的可行性算法。 相似文献
16.
城市化进程中,新的地点不断出现且地点类型不断更新,导致大量未知地点产生,为城市形态的理解和掌控造成障碍。本文综合多种空间分析及文本挖掘技术,创新性地融合Twitter数据中的时间记录与Tweets(用户在Twitter中发表的文本内容)用于地点分类。设计抽取精细的人群活动的时空-内容信息的方法,并通过监督学习方法,利用少量标记样本,自动识别未知地点的类型。最终识别出教育、娱乐、商店、社会服务、交通五种类型的地点,整体精度达67. 6%,表明方法的可行性,为社交数据在地点分类研究中的有效利用提供了新的思路。 相似文献
17.
在中文微博数据的文本情感分类任务中使用机器学习方法 ,为研究不同的特征集对情感分类准确率的影响,综合了一元词特征、句法特征、微博特征、基于评价对象特征、词典特征用于支持向量机分类器中,通过准确率、召回率、F指数比较分析不同特征组合对于分类性能的影响。所提方法用于微博数据中关于药品二甲双胍的评论文本,实验结果表明,一元词特征对文本情感分类的准确率高于其他单类特征,而在与句法特征、微博特征、基于评价对象特征、词典特征的综合使用得到了最高的分类精度。 相似文献
18.
针对异源数据难以集成问题,设计了一种基于装饰模式的数据整合方法。该方法对数据底层处理透明,在较高层次上封装数据会话工厂,以实现数据无缝整合。应用表明该方法在异源数据整合方面具有很好的灵活性。 相似文献
19.
20.
一种基于词上下文向量的文本自动分类方法 总被引:1,自引:0,他引:1
分析了传统文本自动分类方法的不足、词上下文向量的含义及其在自动分类中的作用,提出了一种基于词上下文向量的文本自动分类方法,该方法利用词上下文向量来生成分类器的类别中心向量和待分类文本的文本向量,使分类质量有所提高。 相似文献