共查询到20条相似文献,搜索用时 0 毫秒
1.
个性化知识服务中基于Ontology的用户兴趣挖掘研究 总被引:1,自引:1,他引:1
个性化知识服务是知识经济时代信息服务发展的必然趋势,是满足信息用户多样化、专门化知识需求的高层次服务模式.用户兴趣知识的挖掘和用户兴趣模型的建立是个性化知识服务的重要研究内容.本文将Ontology技术与个性化知识服务结合起来,研究用户兴趣知识的Ontology表示,并以此为基础提出了一种动态的用户兴趣学习和挖掘方法,分析了该方法中参考Ontology的建立、用户兴趣知识的初步学习和用户兴趣模型的完善等关键步骤.研究结果表明,基于Ontology的用户兴趣挖掘可以较为准确地表示、跟踪和学习用户的个性化知识,实现隐性用户兴趣的发现和利用,满足用户特殊的信息需求,是一种提高个性化知识服务质量的有效方法. 相似文献
2.
基于概率主题模型的文献知识挖掘 总被引:1,自引:0,他引:1
对海量的科技文献资源进行知识挖掘能够发现大量有价值的、潜在的知识,有效地提高文献信息的可用性。作者前期研究验证了使用LDA主题模型进行文献知识挖掘的可行性。本文提出了一种新的概率主题模型:Topic-Author模型,该模型对文献的文本信息和作者信息进行联合建模,在分析文献主题同时,发现相关主题方向的研究者分布。基于Topic-Author模型,提出了多维度文献知识挖掘的方法,包括主题挖掘,专家发现,文献标注,重要文献挖掘,文献相似度分析,研究趋势分析和主题关系挖掘。基于教育技术学文献数据集,进行了实验研究。 相似文献
3.
4.
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Allocation)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。 相似文献
5.
6.
基于主题图的英汉跨语言检索模型构建 总被引:4,自引:3,他引:1
针对现有跨语言检索模型普遍存在的翻译准确性差、效率低、成本高等不足,在深入分析主题图技术在揭示语词概念之间的语义关系和多语言支持等方面的优越性能的基础上,提出一个基于主题图的英汉跨语言检索模型,该模型采用索引翻译的策略来实现跨语言检索。该模型的突出特点是能够在提高翻译准确性的同时,有效降低翻译成本。此外,实现起来也比较简单。 相似文献
7.
8.
9.
朱志国 《中国科技资源导刊 (中国信息导报)》2011,(3):62-67
Web 用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等
信息,目前已经成为web 挖掘领域的一个研究热点。文章首先给出Web 访问模式挖掘系统的一般框架模型,然后介绍了
框架模型中主要组成部分的工作原理,在此基础上,对Web 访问模式挖掘系统中的一些关键技术的最新研究进展状况作
了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作
了展望。 相似文献
10.
朱志国 《中国科技资源导刊》2011,43(3)
Web用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等信息,目前已经成为web挖掘领域的一个研究热点.文章首先给出Web访问模式挖掘系统的一般框架模型,然后介绍了框架模型中主要组成部分的工作原理,在此基础上,对Web访问模式挖掘系统中的一些关键技术的最新研究进展状况作了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作了展望. 相似文献
11.
12.
[目的/意义]针对目前使用标签推荐方法所得结果不理想的问题,改进传统相似度计算方式,并结合多种标签推荐方法,提高推荐准确性。[方法/过程]融合基于内容与协同过滤的推荐思想,利用LDA进行相似度计算得出资源与用户的近邻集合,并抽取资源内容关键词,以此构建标签混合推荐模型,最后以"豆瓣读书"为例对模型进行验证,同时与几种标签推荐方法进行比较。[结果/结论]在社会标注系统中,必须考虑用户-资源-标签3个维度,仅考虑单一角度势必会造成结果的不完整,同时在相似度计算时引入LDA能够挖掘潜在语义关系,提高推荐质量,且组合多种方法取长补短可以令推荐结果更为满意。 相似文献
13.
目前,社会化标注已经成为个性化信息推荐领域中的研究热点之一,标签质量对于推荐效果的影响也受到了广泛关注.本文针对标签的质量问题,指出用户标注偏差普遍存在于标注系统中,尤其是形式偏差,给用户兴趣模型的合理提取形成了阻碍.基于此,我们提出了主流标签的概念,以其体现的大众智慧来克服标注偏差所带来的影响,通过分析资源中标签的平均标注率进行主流标签数量的确定,实现资源模型和用户协同模型的构建,并进一步结合兴趣度对用户协同模型加以了改进.最后,基于Delicious的数据和用户参与评分法,文章运用余弦相似性对模型推荐效果进行了验证. 相似文献
14.
基于主题图的学科信息门户 总被引:2,自引:0,他引:2
现有学科信息门户大多数都采用传统的知识组织方法对信息进行组织,但这些知识组织方法表现出很大的局限性,如不能表现信息内容的语义及概念之间的关系等。分析了主题图应用于学科信息门户的可行性,并提出基于主题图的学科信息门户系统结构图。 相似文献
15.
基于主题地图的文献组织方法研究 总被引:3,自引:1,他引:2
网络信息的膨胀导致了文献检索的困难,而检索效率的提高则依赖于其组织方法的改善。主题地图是适应信息资源的网络化而出现的一种新的组织技术,可以较好地解决大量无序、非结构化信息的组织问题。本文提出一个基于主题地图的多层文献组织模型(TMDOM),通过从文献内容中概化出主题并定义主题之间的关联,将领域内主要的概念及其关联以合理的层次结构体现出来,以实现对文献资源的有效组织。试验结果证明了这种组织方法的优越性,通过主题之间的各种关联,实现了有效的信息导航。 相似文献
16.
Topincs是一个开源的、运用了Ajax技术的、具有Web2.0风格的、可以多人协作式构建主题图的工具.为了实际体验主题图在Web2.0中的应用,文章以"2006年数字图书馆前沿问题高级研讨班"为研究对象,通过模拟多人协作,构建了一个会议主题图.通过和原网站的对比分析,可发现使用该系统具有能够发挥参会者的集体智慧、形成头脑风暴效应、提供多人协同工作环境、自底向上构建会议内容的优点,体现了把主题图技术和Web2.0结合起来应用的诸多优势. 相似文献
17.
基于种子文档LDA话题的演化研究 总被引:1,自引:0,他引:1
提出一种基于种子文档的LDA话题演化方法。首先选取种子文档,利用种子文档指导后一时间段文档的建模,然后根据种子文档的语义分布信息对连续时间上的LDA话题进行关联,保证话题的同一性。实验结果证明,在NIPS论文语料集和全国两会新闻报道集中,该方法可以推导特定话题的演化结果,避免关联话题之间存在的演化结果。 相似文献
18.
基于Web挖掘技术的用户兴趣本体学习研究 总被引:2,自引:1,他引:1
目前针对基于关键词的用户模型不能从语义上表达用户需求真正内涵,基于领域本体的用户模型多数忽略研究概念间非分类关系和语义应用环境较分散等缺陷。本文提出一种循环式的基于Web挖掘技术的用户兴趣本体学习模型,即综合应用统计分析、关联规则和聚类分析等技术进行电子商务领域用户兴趣概念及概念间分类与非分类关系学习,面对用户兴趣的迅速变化,还提出一种传递激活方法来实时更新本体或重新进行本体学习,以不断提高该本体的质量。经验证,基于该本体的用户模型在文本过滤等应用中能较上述两种用户模型满足用户个性化服务需求。 相似文献
19.
20.
文章介绍了多源数据融合技术的概念和功用,分析了数字图书馆构建用户偏好挖掘模型的目的,探讨了用户偏好挖掘模型的设计原则、设计目标、设计框架,提出了基于多源数据融合的数字图书馆用户偏好挖掘模型的构建策略,以期提升数字图书馆的服务水平,为用户提供优质的信息服务。 相似文献