首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的/意义]专利关键词提取是专利挖掘任务中非常重要的前置子任务,基于图模型的关键词提取是目前最有效的算法。传统图模型只考虑了单词的局部上下文信息,为了捕获单词的全局信息,提出一种基于图神经网络的专利关键词提取算法,结合词向量与图模型实现专利关键词的提取。[方法/过程]首先,用专利数据集构建异构网络,以专利分类号为标签,训练图神经网络模型,使得同一主题下的单词具有相似的向量表示,获取包含主题信息的词向量;然后,根据专利摘要在滑动窗口内的单词共现关系和词向量相似度,构建融合了单词主题信息的文本图,利用词向量中的主题信息捕获单词的全局联系;最后,在文本图上使用PageRank算法,获取关键节点,构成专利的关键词。[结果/结论]与基线方法相比,该算法在提取专利关键词时,能够检测到新颖性与准确性更高的关键词。  相似文献   

2.
为了进一步提高人脸图像的识别率,提出了一种相关分析融合的人脸图像识别算法。首先通过采用压缩测量数据得到人脸图像,然后通过划分子模式的方法去除图像中的小样本,提取局部特征,采用成分分析提取人脸图像的整体特征,通过算法对人脸图像特征进行融合,从而消除人脸部冗余信息,最后通过3个人脸数据集对算法进行测试。仿真实验表明,本文的算法相对于参比算法,提高了人脸图像识别精度,具有很好的鲁棒性。  相似文献   

3.
陈静 《大众科技》2012,(6):46-47
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了改进,提出了Apriori改进算法.Apriori改进算法采用二进制数据垂直表示方法,只用扫描事务数据库一次得到一阶大项集的二进制数据垂直表示.K阶候选项集的操作只要基于这个一阶大项集,而不需重复扫描数据库,从而提高了挖掘算法的效率.  相似文献   

4.
针对编辑部手工提取网络上传数据过程烦琐、工作量大的问题,在需求分析的基础上,设计了解析网络上传数据的批处理算法,并利用计算机语言PYTHON开发了应用程序.该应用程序能够实现对论文题名、作者信息、基金项目、论文起止页码、中英文摘要、中英文关键词、参考文献以及投稿和修订日期等信息,按论文文件名批处理操作.与手工操作相比,该方法能将数据提取效率提高15倍以上,可满足编辑部快速处理网络上传数据的需要.  相似文献   

5.
边缘是图像的基本特征之一,携带了大量图像信息。边缘检测能够提取边界有用的结构信息,因此边缘检测具有重要作用。论文提出了基于特征值的阳性选择的图像边缘检测算法。该算法基于阳性选择原理,根据特征值匹配规则,综合图像的梯度、非极大值抑制、最大梯度差三个特征值构造"自我集",生成动态检测器对图像进行边缘检测。实验结果表明,该算法在边缘检测中可行,且对比canny和Prewitt边缘检测算法,能得到更好的图像边缘。  相似文献   

6.
基于数据挖掘技术的专利信息分析   总被引:3,自引:0,他引:3  
马芳  王效岳 《情报科学》2008,28(11):1672-1675
随着计算机技术和网络技术的的发展,各行各业积累的数据量越来越大.而专利信息集是目前世界上最大的技术信息集,几乎囊括了一切应用领域内的技术成果.为了提取隐含在其中的、人们事先不知道但又潜在有用的知识,将数据挖掘技术应用于专利信息分析,如采用聚类算法对专利文本进行挖掘、采用关联规则对专利发明人进行挖掘,以发现用户感兴趣的知识,并使之转化为有效的竞争情报.  相似文献   

7.
李念峰 《现代情报》2007,27(11):161-163
介绍一种网络情报收集系统的组成及体系结构,并结合这种体系结构分析系统实现过程中的关键技术及实现方法,提供生成自动摘要的流程.给出自动摘要生成过程中关键词及摘要句提取算法,分析摘要质量评价方法,提供了保障系统安全运行的措施,  相似文献   

8.
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。  相似文献   

9.
本文提出了一种基于信息隐藏技术的安全二维码算法,该算法通过改变二维码中黑白图像块像素行程的奇偶性来嵌入信息。通过嵌入信息改变二维码的形态,有效保护二维码的内容。嵌入的信息可以被正确提取,提取信息后载体二维码可以无损的恢复。该算法在起到保护二维内容的同时还实现了一种可逆隐藏方案,具有广泛用途。实验证明该算法运算速度快,能有效地保护和恢复二维码信息。  相似文献   

10.
是基于加密技术中的加密哈希算法的,其工作原理是将信息分组(如:128位为一组),分组后用单向哈希函数将信息摘要成固定长度的秘文。同样信息摘要成秘文必定一致。  相似文献   

11.
模型的预测效率不仅取决于自身的性能和参数设定,还取决于训练集的信息质量。高噪声环境中的知识提取往往预测表现并不稳定。本文思考从总体流程方面思考改进决策系统的方案,基于粗糙集理论和信息论提出了一种组合度量信息系统可决策性的通用方法,该算法具有快速、简洁、通用性强等特点,在多个数据集的验证下具有较高的可靠性。  相似文献   

12.
图像中的特征点可以用来匹配图像.本文给出了一个基于SIFT特征点集之间距离的图像匹配算法.首先提取出图像中的所有SIFT特征点,然后根据奇异值分解再选出特征点集,根据点集不变性计算出距离,最后根据距离值匹配图像,实验结果显示,该算法具有可行性.  相似文献   

13.
王倩丽 《科技广场》2010,(1):112-114
本文对Message-Digest Algorithm 5(信息-摘要算法)进行了简要描述,并对MD5算法的原理进行了深入分析。同时采用目前流行的C#语言对MD5算法进行了具体的应用,实现了MD5加密演示系统。虽然MD5算法因王小云教授在2004国际密码学会议上发表的论文引起了很大的反响,但MD5算法仍然在数字签名、电子商务、信息加密等领域中有着非常广泛的应用。  相似文献   

14.
在MATLAB环境下,取ORL人脸数据库的部分人脸样本集,基于PCA方法提取人脸特征,形成特征脸空间,然后将每个人脸样本投影到该空间得到一投影系数向量,该投影系数向量在一个低维空间表述了一个人脸样本,这样就得到了训练样本集。同时将另一部分ORL人脸数据库的人脸作同样处理得到测试样本集。然后基于最近邻算法进行分类,得到识别率,接下来使用BP神经网络算法进行人脸识别,最后通过基于神经网络算法和最近邻算法进行综合决策,对待识别的人脸进行分类。  相似文献   

15.
基于回归分析的信息协同过滤算法预测研究   总被引:1,自引:1,他引:0  
信息过滤是图书情报领域的一个研究热点.分析了IBCF、UBCF和RBCF三种协同过滤算法,并用四种不同的数据集对三种算法进行性能测试.实验证明,不同的数据集对应的最优协同过滤算法各不相同.进而利用回归分析模型预测某一具体数据集的最优协同过滤算法,发现回归分析能够很好地进行算法预测.  相似文献   

16.
针对杂波环境中的三维机动目标的点迹提取问题,提出了一种基于hough变换的目标点迹提取算法,将三维机动目标分别进行平面映射,然后在每个平面采用hough变换处理,对变换结果进行检测,得到所需要的目标点迹信息。采用该算法得到的目标点迹距离和角度信息,可快速起始杂波环境中的目标航迹,并降低数据处理的运算量。仿真结果表明,该算法具有较好的点迹提取能力。  相似文献   

17.
从产品角度来看,图片验证码识别增加了时间成本和精力,因此有必要开发一个验证码图片识别系统改善工作效率。考虑到目前各种机器学习算法的优点,本文提出了基于v-支持向量分类的验证码图片识别算法,它不仅运用快速独立成分分析算法提取特征,并且利用文化算法最优化v-支持向量算法的模型核宽度和参数v。实验结果表明,数字验证码图片经过预处理后,每组图片的训练集的数字识别率为100%,而测试集的识别精度大约为99.8%。  相似文献   

18.
通过挖掘生物信息大数据,从生物信息大数据库中提取感兴趣的数据特征,分析生物信息大数据集的细节结构,提高对生物信息的采集、处理、存储、传播,分析能力。传统的生物信息大数据挖掘模型采用基于小波多窗谱提取的生物信息挖掘算法,由于生物特征的属性权重需求各异,数据挖掘精度不高,提出一种基于梯度采样局部收敛的生物信息大数据挖掘模型。首先构建生物信息大数据库模型和生物信息特征挖掘实体模型,采用提取采样局部收敛方法实现对数据挖掘模型的改进,通过求解最优输入控制序列以及索引系统最优目标函数,实现系统的控制输入和预测,使用梯度采样局部收敛的方法进行生物信息大数据挖掘检测,得到生物信息大数据的梯度采样局部收敛属性集合。仿真结果表明,能实时准确地实现对生物信息的储存、检索和分析,提高数据挖掘能力,收敛精度较高。  相似文献   

19.
通过研究聚类算法在图像处理上的应用,提出了一种基于高斯混合模型聚类的图像检索方法。该检索方法首先提取每幅图像的特征,并以特征值为数据集建立高斯混合模型,得到所有图像的高斯混合模型。再以所有图像的混合模型参数集作为数据集,用基于高斯混合模型的聚类算法进行聚类。最后输出检索例图所在的类,即得到检索结果。  相似文献   

20.
文章提出一种基于法向量夹角的点云特征线提取算法,该算法过程主要分为特征点提取和特征点连接两个阶段。在基于法向量夹角的特征点提取的过程中,通过构建最小生成树来实现法向量重定向,一定程度上提高了传统法向量提取特征点的准确性,随后对初选特征点进行细化和删减,得到点云数据的特征点集。在特征点连接阶段通过建立特征点的最小生成树以及相应的最小生成树裁剪算法构建特征曲线。实验证明,该算法原理简单,能很好地提取点云模型尖锐特征与细节特征,是一种有效的三维点云特征线提取算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号