首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对人脸识别问题,提出了一种新的算法。该算法利用融合的PCA和LDA算法进行特征提取,并使用蚁群优化的BP神经网络进行人脸识别。使用融合的PCA和LDA算法对特征向量进行提取压缩,为了提高BP神经网络对人脸的分类精度和减少训练时间,使用蚁群算法优化BP神经网络的初始参数,并使用优化后的BP神经网络进行训练和人脸识别。在ORL人脸数据库的仿真结果表明,该算法能有效提高人脸识别性能,具有较高识别率。  相似文献   

2.
梁珊  邱明涛  马静 《情报科学》2017,35(7):44-49
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结 构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于 LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词, 然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的 位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真 实新浪微博数据为实验对象,实验结果表明基于LDA-WO模型的特征词提取方法进行特征抽取,抽取到的特征词 可读性更强,可弥补传统LDA模型在话题可解释性上的不足。  相似文献   

3.
[目的/意义]为了将大数据更好地用于循证决策,文章构建了循证决策视角下的患者健康主题分析模型。[方法/过程]首先使用LDA主题模型对高血压问答数据进行主题探测,并结合文献提炼出高血压八大主题;再次使用问卷调查法和层次分析法对主题探测结果进行评估;最后对得到的证据进行实践讨论。[结果/结论]文章对大数据和循证决策的结合做了尝试性探索,结果表明循证决策视角下的患者健康主题分析模型,具有一定的实用性和创新性。  相似文献   

4.
[目的/意义]为了将大数据更好地用于循证决策,文章构建了循证决策视角下的患者健康主题分析模型。[方法/过程]首先使用LDA主题模型对高血压问答数据进行主题探测,并结合文献提炼出高血压八大主题;再次使用问卷调查法和层次分析法对主题探测结果进行评估;最后对得到的证据进行实践讨论。[结果/结论]文章对大数据和循证决策的结合做了尝试性探索,结果表明循证决策视角下的患者健康主题分析模型,具有一定的实用性和创新性。  相似文献   

5.
【目的/意义】随着LDA模型成为微博信息推荐的主要工具,众多的LDA演化模型的使用问题成为研究者 亟待解决地问题。【方法/过程】首先,从演化发展角度对LDA模型运行机理进行了解析,揭示了模型使用的先决条 件和算法内涵;其次,从不同需求的视角揭示了RB-LDA、RT-LDA、C-LDA、MB-LDA等扩展模型对LDA模型的 功能性补充;最后,提出LDA模型的技术演化方向。【结果/结论】结果表明可利用微型本体来提升语义性、利用多种 模型融合来提升精度、利用大数据来提升数据质量是LDA模型未来的演化方向,可使LDA模型信息推荐能力的更 具个性化和精准化。  相似文献   

6.
[研究目的]从热点主题的特征维度出发,基于LDA模型构建热点主题识别的指标体系,使识别结果更加清晰明确、具有更强的热点指向性,为热点主题的识别工作提供新的思路与方法。[研究方法]以中国知网2000-2020年我国制氢领域的期刊文献为数据源,利用LDA模型抽取研究主题;分析热点主题的影响力特征及关注度特征,并基于LDA的输出信息对其进行量化,从影响力特征维度和关注度特征维度构建热点主题识别的指标体系;最后通过指标计算确定热点主题并进行主题内容分析。[研究结论]以我国制氢领域为例进行实证分析,发现了光催化分解水制氢技术、甲醇制氢技术、光催化剂性能及其制备、光伏发电制氢技术这4个热点主题。通过与共词分析法的对比,验证了指标体系对于热点识别的有效性。  相似文献   

7.
【目的/意义】从海量论文元数据中抽取算法术语并构建它们之间的创新演化关系,有利于对算法的有效管 理和运用,以帮助科研工作者提升研究效率、采纳前沿成果。【方法/过程】首先,以GAN算法论文摘要为语料,通过 人工标注与规则抽取相结合的方式进行算法术语标注,并利用BERT-BiLSTM-CRF模型实现算法术语的自动抽 取。然后,将建立的模型应用于LDA算法论文的被引文献元数据中抽取算法术语,依据规则判断和引文关系,从被 引内容中抽取LDA算法的创新演化路径并构建。【结果/结论】以GAN论文为实例的算法术语实验中,精确率、召回 率与F1分数分别达到了0.81、0.63与0.71,并应用关系抽取方法成功构建了LDA算法的创新演化路径,该方法可以 有效推动算法进化网络构建和算法检索与追踪等方面的工作,丰富创新扩散理论的相关研究。【创新/局限】拓展了 命名实体识别技术的应用领域,为计算机算法管理提供了良好的思路。后续可优化创新演化路径的构建方法。  相似文献   

8.
人脸识别引入一种新的具有先验类别信息的非线性主元分析算法ED—PKPCA,通过将样本类内差和类间差融入总体方差中,以求分类效果更好。通过选建样本库,减少特征向量维数,利用欧式距离进行分类器设计,简化计算。实验结果表明,在人脸识别技术中,该算法明显优于KPCA算法,识别效果较好。  相似文献   

9.
[目的/意义]科学准确识别关键共性技术对企业和国家来说都是至关重要的战略议题。[方法/过程]文章提出了一种基于专利文献分析的关键共性技术识别框架,运用文本挖掘和技术演化分析方法,获取特定领域的关键共性技术。首先,使用Viterbi算法识别专利文献中的专业术语,通过LDA算法捕捉专利文献中的技术主题聚类;其次,通过将技术主题的共类特征数值化,作为共性程度的度量;随后,将技术主题节点在技术演化转移网络中的关键程度作为技术关键性的表征,并使用PageRank算法衡量技术主题的关键性。最后,以机器人及数控机床技术为例,验证了该方法的可行性和有效性。[结果/结论]该方法可实现高效、准确的关键共性技术识别,为国家制定创新扶持政策提供支撑。[局限]研究仍需扩大科技文献的收集范围,以实现更全面的关键共性技术识别。  相似文献   

10.
【目的/意义】通过分析近年来我国图书馆法律法规的内容特征及其发展脉络,探究其发展趋势,为我国图 书馆法律法规研究提供借鉴,为图书馆法律体系建设提供参考。【方法/过程】以中国知网作为数据源,选取 2008- 2018年《中国图书馆年鉴》中法律法规与政策性文件中法律法规的全文,作为研究样本,利用LDA模型进行主题内 容提取和挖掘。【结果/结论】通过主题研究发现我国图书馆专门法律法规较少,实施较晚,应加强专门法的研究,促 进综合性图书馆法出台,加快图书馆法律体系建设。【创新/局限】运用LDA主题建模方法对现行大量图书馆法律法 规文本进行主题数据分析,探究图书馆法律法规的内容特征和发展机理具有创新意义。由于算法中的分词方法对 个别专业词汇切分可能存在局部偏差,会对关键词提取准确性造成微小影响。  相似文献   

11.
边扬帆  成全 《情报探索》2020,(1):112-119
[目的/意义]旨在了解国内科技政策的热点及政策导向,以期为国家科技政策的制定和完善提供参考。[方法/过程]以2015-2018年国务院和科学技术部印发的科技政策为研究对象,运用共词分析法和社会网络分析法,以及TF-IDF算法对热点主题词进行提取并分析,采用狄利克雷主题模型(LDA)提取科技政策主题并进行主题聚类,挖掘重点关注的政策主题,并对科技政策文本运用MDS(multidimensional scaling)方法进行降维分析,并对科技政策的走向进行分析。[结果/结论]国家科技政策的制定主要围绕高新技术产业、科研诚信、专项研究、科技人才发展、科技成果转化、知识产权等主题领域进行;关于教育、产能激励、装备制造、创新创业、众创空间、加工贸易、科技成果转化与知识产权保护等主题领域已经引起并将持续受到相关政府部门的重点关注。  相似文献   

12.
人脸图片数据本质上是一个三维张量数据,而传统机器学习方法在提取人脸结构特性信息时将其展开为一维向量,这破坏了数据的内在结构信息。张量分析算法用于人脸结构数据克服了数据向量化带来的缺点。本文对比基于向量化的线性判别分析(linear discriminant analysis,LDA)算法,对40幅人脸图片进行识别,实验表明张量线性判别分析算法最高识别率达到100%,其总体识别率明显优于LDA算法。  相似文献   

13.
在许多情况下,并非所有类别都有着同样的重要性和实际意义,我们希望在特征提取时能体现出类间重要性和意义上的差异,而传统特征提取方法缺乏解决这一问题的能力.为此,利用一种基于主观引导特征提取法对光谱数据进行特征提取和分类,其主要思想是:将人的主观意图融合到特征提取中,提取有利于具有优先权类别的分类特征.结果表明,与传统线性鉴别分析法(LDA)相比较,该方法可获得更加有效的分类特征.  相似文献   

14.
【目的/意义】为微博用户生成质量较高的标签,帮助用户对微博特征进行描述。【方法/过程】首先,分析微 博的特征建立候选标签与候选词表。随后,用 LDA对用户的微博进行主题分析,将用户的微博与预选标签相匹配, 生成预选标签。最后,用 LDA对用户关注的人及用户的粉丝的微博进行主题分析,对预选标签进行控制生成最终 标签。【结果/结论】实验结果表明,本文以 LDA为基础提出的标签生成方法具有不错的效果,最终生成的标签能够 较为准确地描述用户的微博特征。  相似文献   

15.
线性判别分析(LDA)具有很好的分类性能,但是计算复杂度一般较高。为了有效地降低LDA算法的计算复杂度,本文提出了一种基于k-means聚类的快速学习算法。该算法首先根据k-means聚类算法对原始样本进行聚类,计算聚类簇的样本中心作为新训练样本,然后再利用LDA算法进行分类。由于通过聚类算法有效地压缩了训练样本集的规模,因此算法具有更高的效率。在语音识别数据集上的实验充分验证了本文算法具有较好的分类性能,而且效率更高。  相似文献   

16.
本文针对环境监测中监测点的局部布局的优化算法进行了研究,通过对局部布局算法物源分析法、特征分析法、密切值法、模糊集对分析法、灰色聚类法的介绍,原理分析,并以2001—2002年南京市城区环境空气中主要污染物为数据源模型,对实验分类结果和算法效率的分析得出最优的局部布局优化算法。  相似文献   

17.
为了提高动画素材的使用效率降低制作成本,论文提出了一种基于内容的动画素材检索方法,分别用96色非均匀量化算法、灰度共生矩阵和形状无关矩提取颜色、纹理和形状特征,并将多特征进行融合,通过实验取得了很好的效果。  相似文献   

18.
根据B型超声得到的不同发育阶段的胎盘图像,提出胎盘成熟度自动分级的方法。首先,分别从空域、频域和纹理表征胎盘B超图的特征,然后利用核主成分分析(KPCA)进行特征选择,最后用二叉树结构多分类支持向量机对胎盘进行分级。实验及临床应用表明:该方法能得到与人工分级基本相吻合的结果,经过特征选择处理后分级识别率明显提高,具有较好的临床应用价值。  相似文献   

19.
【目的/意义】随着互联网在社会中的影响力逐渐增大,面对网络群体性事件对社会生活的冲击,需把握网络群体性事件的演化规律,确定事件类别,提炼事件特征,基于不同类别的网络群体性事件,提出有针对性的应对措施。【方法/过程】通过LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,最终运用SVM算法进行网络群体性事件聚类分析,得到五类网络群体性事件。【结果/结论】构建的网络群体性事件动态识别模型,通过大量的文本训练,在事件聚类数为5时具有良好的解释性,完成了网络群体性事件的客观分类,分别为:经济型、社会型、文化型、民族型和环境型,为政府分类应对策略提供依据。【创新/局限】利用LDA主题模型和Kmeans算法,减少了模型的迭代次数,确定最佳主题数,提高了网络群体性事件识别结果的准确性,但是运用慧科新闻数据库搜集到的文本数据范围有限,且分类结果反应的事件特征具有一定局限性,后续研究可进一步扩大动态文本数据库,对分类算法进行改进和深化。  相似文献   

20.
针对一般的语音识别算法均存在抗噪能力不好的问题,无法满足音乐检索系统的需求。针对于此,本文以抗噪能力为基础对MFCC语音识别算法进行了优化,第一步是通过F比方法加权优化了MFCC算法的特征参数,估计出各维特征分量对识别率的影响,并将其提取出来,然后采用主成分分析法对提取的特征分量进行降维处理,以降低计算复杂度,减少数据存储量,加快训练时间,最终提高识别效率。算法仿真结果表明,本文提出的基于抗噪能力优化的MFCC语音识别算法具有较好的抗噪能力,比传统MFCC算法对音乐检索的精确度更高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号