共查询到10条相似文献,搜索用时 15 毫秒
1.
介绍了文本数据挖掘和知识提取的基本理论,然后分析了网络信息的检索与挖掘的特征,特别是文本挖掘、Web数据挖掘和基于内容数据挖掘与之相关联的系列问题.在此基础上,分析了Web知识库的设计、建立、文本数据挖掘和知识发现所需的理论和技术,对Web知识库系统的架构和功能模块进行分析和设计,建立了基于文本数据挖掘的Web网络知识库的模型. 相似文献
2.
【目的/意义】如何识别文本中的知识片段进行标引,使检索系统能检索文本知识内容是提高用户信息利 用效率的关键。【方法/过程】在文献调查的基础上,文章基于本体概念模型和Word2Vec词向量模型阐述了文本片 段语义标引的流程框架,并对本体语义扩展、神经网络模型训练、文本片段标引、文本片段权重获取四个部分的关 键环节及技术做了详细说明。最后通过实验验证了该流程框架。【结果/结论】实验结果显示该方法在文本知识片 段识别上是有效的,知识识别的准确率达到80%,能够实现对文本知识内容进行标引。该方法为自动化实现基于知 识的文本信息组织提供了有益的参考。 相似文献
3.
综合运用基于文本与基于内容技术检索Web图像 总被引:1,自引:0,他引:1
本文介绍了基于文本和基于内容的图像检索技术,并归纳分析了Web图像的特点,指出综合运用文本和内容信息共同检索Web图像,最后对建立Web图像搜索引擎提出了建议。 相似文献
4.
为及时有效地识别潜在技术机会,采用文本挖掘和异常值检测的方法,提出一种基于专利文本的技术机会识别方法.首先采用文本表示模型Doc2vec技术对专利摘要进行建模,以更深层表征文本语义信息;然后利用基于密度的离群值检测算法,识别出具有潜在技术机会的专利方向;最后以深度学习领域潜在技术识别为例,构建专利检索式并收集458条专利文献作为数据集.实证结果总结出4类主题共10个潜在的技术机会,验证了该基于专利的技术机会识别方法的有效性,可为企业相应技术应用、研发和创新提供参考. 相似文献
5.
本文通过分析电子商务购物网站中基于文本信息检索的现状以及存在的问题,结合虚拟购物平台的特点,提出了基于内容的图像检索技术在购物网站中的应用,并进一步分析了基于内容的图像检索技术的特点、方法以及用于购物网站的检索匹配过程。 相似文献
6.
7.
针对主观文本识别、情感分词以及情感分类模型选择等研究方法上存在的效率较低、文本表达维度高等问题,文章提出了一种基于旋进原则和AdaBoost集成技术的回归SVM情感分类模型(AdaBoost+ SVM-L),不仅提高了主观文本标注准确率,更通过AdaBoost+ SVM-L模型对情感样本的极性和强度进行了判断,实现了文本情感强度阈值的可视化.并通过分组对照实验比较了SVM、NB以及AdaBoost+ SVM-L模型的性能指标. 相似文献
8.
数字图书馆多媒体信息检索技术及发展 总被引:4,自引:0,他引:4
讨论了数字图书馆多媒体信息检索中基于内容的文本、图像、音频、视频检索技术,介绍了信息检索的研究方向一智能检索和数据挖掘技术。 相似文献
9.
基于一个整合了主题建模、专利文本分析和主题强度演进的量化分析框架,通过复合检索式采集全球范围内智慧城市相关专利,应用主题建模和文本挖掘方法刻画智慧城市技术热点演进的知识图谱,并对潜在热点主题进行识别与讨论,从而进一步丰富基于专利文本数据进行技术热点分析的方法体系。 相似文献