首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 234 毫秒
1.
以提高领域概念相关性判断的准确度为研究宗旨, 提出综合利用中文维基百科的分类体系结构和概念释义内容进行概念间语义相关度计算的方法.选取中文维基百科分类体系下的图书情报领域的概念为实验对象, 将基于分类信息和文本信息的加权算法与单独基于分类信息的语义距离算法和信息量算法, 以及基于文本信息的文本重叠算法进行对比分析.实验结果表明:加权算法能取得更好的效果, 可为实现面向领域的信息检索、领域本体构建等应用提供重要技术支持.  相似文献   

2.
文章分析维基百科中的文档、目录、超链接、重定向以及消歧义等基本元素与结构关系特点,围绕维基百科在信息检索、文本分类、文本聚类、歧义消解、查询扩展与信息抽取以及本体构建等信息处理任务中的典型解决方法与相关项目,综述和评析基于维基百科的语义知识挖掘的研究与应用方法,从整体上把握基于维基百科的知识挖掘研究现状与进展,为当前知识服务系统建设提供借鉴。  相似文献   

3.
李慧  胡吉霞 《图书情报工作》2020,64(18):114-125
[目的/意义]针对包含单一类型知识单元的知识网络难以全面反映学科知识结构的问题,提出一种从多维度进行知识网络结构融合的方法,为学科领域知识结构挖掘提供借鉴。[方法/过程]利用LDA及TF-IDF方法抽取学科知识单元,然后运用语义相似度和关键词共现分析方法构建3个学科知识子网络:主题网络、关键词网络和实体网络,并采用空间节点传递对齐方法对齐子网络节点,接着设计基于图卷积操作的自编码模型对知识节点进行表示,最后通过计算余弦相似度重构学科知识网络。[结果/结论]实验部分以人工智能领域为例,构建融合主题、关键词和实体的学科知识网络并展开分析,实验结果表明,本文所提方法能有效地揭示学科领域研究内容和知识结构,为学科知识发现与组织研究提供有益参考。  相似文献   

4.
维基百科信息自组织模式探析   总被引:5,自引:0,他引:5  
维基百科是基于wiki理念和技术发展起来的.它按照自组织的模式运作,通过网络用户的参与迅速发展,最终形成了超大规模的网络百科全书,目前已涵盖了人类所有知识领域.维基百科以自身取得成功的事实,说明自组织、开放性的wiki理念不仅是完全实际可行的,还使知识生产与共享的方式发生了根本的变化.就知识的平等发布和共享、知识的自组织演进和自组织管理方面来看,维基百科是有益而成功的尝试.  相似文献   

5.
[目的/意义]文献分析与社会网络分析是知识发现的重要方式,根据知识演化的动态性和层次性,提出一种基于动态多层网络的知识解构和迁移路径识别方法。[方法/过程]首先,通过等时间段划分、知识要素提取、知识网络构建与分层,确定分层网络结构;然后采用单层共有节点占比和Jaccard系数计算知识迁移跨度,采用辛普森多样性指数确定知识要素的重要性,并筛选出知识迁移的主要路径;在此基础上,对知识网络予以重构,明确知识要素间的内在逻辑。以2001—2021年信息管理领域的24种期刊的22 049篇文献为样本,以3年为间距划分为4个阶段,并采用CiteSpace软件进行关键词提取和初步统计,运用Pajek软件进行网络分层和基于重要路径的重构。[结果/结论 ]结果显示:近些年来,信息管理领域形成了以企业为核心的知识结构、以电子商务与用户行为为核心的知识结构和以信息技术与创新为核心的知识结构,信息技术是企业和用户间的重要连接。较聚类分析、时间拓展网络分析而言,所提出的方法不仅能够展示知识要素在知识迁移过程中的重要性,而且重构的网络所展示的知识要素模块及其内在关系逻辑更为具体明确。  相似文献   

6.
赵辉  刘怀亮 《图书情报工作》2013,57(11):120-124
为解决短文本特征词少、概念信号弱的问题,结合维基百科进行特征扩展以辅助中文短文本分类。通过维基百科概念及链接等信息进行词语相关概念集合抽取、概念间相关度计算,利用消歧页结合短文本上下文信息解决一词多义问题,进而以词语间语义相关关系为基础进行特征扩展,以补充文本特征语义信息。最后,给出基于维基百科的中文短文本分类算法,并对其进行实验验证。结果表明,该算法能有效提高中文短文本分类效果。  相似文献   

7.
基于关键词共现的概念知识网络具有明显的层次结构,以节点k-core值为依据可将其划分出层次。引入三元闭包作为知识网络分析的基本单元,在层次视角下,三元闭包存在多样性,可用于描述节点的同层聚集、知识融合、知识分化等多种现象。以“数字图书馆”领域为例,由其关键词组成的概念知识网络可进行分层,引入节点层级差异和三元闭包类型后,可以更深入地分析知识网络中节点的微观关联结构。  相似文献   

8.
外部因素对维基百科序化过程的影响分析   总被引:3,自引:1,他引:2  
维基百科是一个开放的知识系统,从而不可避免地受到外部环境的影响。本文以维基百科为研究对象,选择了"可信度危机"和"政府限制访问"等若干具有代表性的因素,研究了外界环境对维基百科序化过程的影响。结果表明,外部因素的确影响了维基百科的发展,但是并没有遏制其发展趋势。  相似文献   

9.
[目的/意义]探索领域知识网络中的核心知识涌现有助于揭示知识发展的内在机理,对于掌握领域知识发展脉络以及发展模式具有重要意义。[方法/过程]以复杂网络的思想为基础,基于关键词的邻接关系构建领域知识网络。采用Hub涌现的分析方法,对领域知识网络从时间序列上进行动态跟踪与分析。从知识节点的度序列分布、熵值分析、特定节点涌现3个方面对领域知识网络的知识涌现现象进行分析。[结果/结论]研究结果表明:领域核心知识涌现过程中随机性与非随机性交互影响;领域核心知识涌现在总体上呈现由随机性主导到结构性主导的演进趋势;领域中涌现出的核心知识并非是一劳永逸一成不变的。  相似文献   

10.
为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。  相似文献   

11.
[目的/意义]探索领域知识发展过程中的聚类演化问题有助于揭示知识聚类的特征和规律,对于掌握知识生长演进过程中关联知识的聚集具有重要意义。[方法/过程]以复杂网络的思想为基础,基于标签邻接关系的发生值构建时间序列领域知识网络。即依据网络模体的理论,采用网络聚类系数的分析方法,对领域知识网络进行动态跟踪与分析;结合网络密度、特征路径长度、节点度值、封闭三元组等指标,从随机因素、度相关性、邻近关联3个方面对领域知识发展过程中的聚类演化现象进行分析。[结果/结论]研究结果表明:①领域知识在发展进程中始终保持较高的聚类性;②领域知识的聚类性同时包含随机性与结构性(非随机性)两方面因素; ③领域知识聚类的动态状态在小世界网络和无标度网络之间摇摆演化; ④领域知识的聚类状态在网络全局和局部节点之间表现出一定的差异性。  相似文献   

12.
[目的/意义]对新媒体环境下网络节点影响力进行研究,能够深入剖析信息传播规律,从而有助于采取针对性措施对信息传播进行合理控制。[方法/过程]基于信息熵理论构建新媒体环境下网络节点影响力模型,以微信公众号为例进行节点影响力测算,对节点直接影响力、间接影响力和综合影响力进行深入分析,最后运用Matlab软件对所构建模型进行仿真分析。[结果/结论]新媒体环境下网络节点综合影响力随着连接节点数量和节点间互动频率增加而增大,直接影响力和间接影响力也以不同幅度增长,但当间接影响力信息熵值超过100时,直接影响力成为影响节点综合影响力的主要因素。  相似文献   

13.
This work maps and analyses cross-citations in the areas of Biology, Mathematics, Physics and Medicine in the English version of Wikipedia, which are represented as an undirected complex network where the entries correspond to nodes and the citations among the entries are mapped as edges. We found a high value of clustering coefficient for the areas of Biology and Medicine, and a small value for Mathematics and Physics. The topological organization is also different for each network, including a modular structure for Biology and Medicine, a sparse structure for Mathematics and a dense core for Physics. The networks have degree distributions that can be approximated by a power-law with a cut-off. The assortativity of the isolated networks has also been investigated and the results indicate distinct patterns for each subject. We estimated the betweenness centrality of each node considering the full Wikipedia network, which contains the nodes of the four subjects and the edges between them. In addition, the average shortest path length between the subjects revealed a close relationship between the subjects of Biology and Physics, and also between Medicine and Physics. Our results indicate that the analysis of the full Wikipedia network cannot predict the behavior of the isolated categories since their properties can be very different from those observed in the full network.  相似文献   

14.
This study examined gender differences in information behavior concerning Wikipedia. Data were collected using a Web survey in spring 2008. The study used a convenient sample that consisted of students who had taken an introductory undergraduate course at a large public university in the Midwestern United States. A total of 134 out of 409 students participated in the study. As information consumers, male students used Wikipedia more frequently than their female counterparts did. With respect to the purposes of Wikipedia use, male students used Wikipedia for entertainment or idle reading more than their female counterparts, while there were no gender differences regarding Wikipedia use for other purposes. Male students were more likely to discount the risks involved when using Wikipedia information compared to their female counterparts. Furthermore, male students had higher ratings than female students regarding most aspects of Wikipedia, including outcome expectations, perceptions about its information quality, belief in the Wikipedia project itself, emotional states while using Wikipedia, confidence in evaluating information quality, and further exploration. Finally, there was no gender difference regarding the number of years of Wikipedia use. However, male students reported having more positive experiences with the information quality of Wikipedia than their female counterparts. Overall, the findings of this study were consistent with those of previous studies concerning gender. Given the acknowledgment of the knowledge value of Wikipedia in recent literature, it seems that there are more advantages to using Wikipedia than there are disadvantages. The current study shows that male students seem to enjoy such benefits more than female students and may have more opportunities to develop their information literacy skills than female students by actively using Wikipedia. This suggests that educators need to encourage female students in particular to explore Wikipedia strategically as an initial information source so that they can develop their information literacy skills for unconventional sources.  相似文献   

15.
[目的/意义]研究利用维基百科条目的丰富信息来补充完善当前中文名称规范档附加信息不足、名称难以准确区分的问题。[方法/过程]探讨网络环境下个人名称规范档的部分缺陷和维基百科相应的优势,重点阐述维基百科的接口Media Wiki API,并从两个方面探讨实现个人名称规范档与维基百科的链接应用:一是实现从名称规范档到维基百科的链接,二是动态生成个人简介,为名称规范档提供必要的信息来源。[结果/结论]集成维基百科的资源实现中文名称规范档信息的自我完善,有效地建立中文人名名称规范档与维基百科的链接,有助于个人名称的识别与检索。  相似文献   

16.
成全  许爽 《图书情报工作》2014,58(12):124-129
通过对《书目记录的功能需求》(FRBR)概念模型体系结构中实体、属性及关系这3个基本要素的分析,探寻由FRBR模型抽取出的馆藏资源元数据关联网络的构成要素,并对符合FRBR的馆藏资源元数据知识节点与关联关系所构成的关联网络结构进行层次划分,形成以元数据记录属性为支撑的微观层面关联网络及以元数据记录之间或规范数据集之间关联关系作为支撑的宏观层面关联网络。而词汇集的建立、术语复用机制、数据集链接桥机制成为构建馆藏资源元数据关联网络的基本要素。馆藏资源元数据关联网络的建立对于揭示馆藏资源内部的知识结构、扩展知识检索的范围、推荐关联知识、辅助知识发现等均具有重要的价值。  相似文献   

17.
付巧 《图书情报工作》2016,60(23):143-148
[目的/意义]维基百科是众包模式应用的杰出范例,研究维基百科的检索系统有助于促进以众包方式编纂的同类网络百科全书的研究和发展。[方法/过程]通过对维基百科检索结构的系统描述,分析发现在众包编纂模式下维基百科检索系统的3个区别性特征。在此基础上,探讨维基百科检索系统存在的问题。[结果/结论]维基百科检索系统的区别性特征包括:检索系统功能的多样性、检索系统的开放性、编辑历史的可检索性;维基百科检索系统存在着超链接密度较高、网络文献问题频现、参见系统内容缺乏一致性等问题。未来的研究应在检索方式的设置和管理方面进行探讨。国内同类网络百科全书应在汲取维基百科先进经验的同时,结合自身检索系统设置的实际情况,不断完善各种检索途径的功能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号