共查询到19条相似文献,搜索用时 921 毫秒
1.
张寅生 《现代图书情报技术》2007,2(5):57-61
针对因特网统一资源标识符缺乏自然语言语义的局限,研究基于角色、资源空间层次和本体的网络科技信息资源定位和导航技术,其特点是定位标识符具有自然语言语义,用以描述浏览者角色、对资源的类别需求以及资源内容相关的知识陈述对象和知识量纲。在服务器端相应地建立这些参数的认知方法,进而实现基于语义认知的网络科技信息资源定位和导航。 相似文献
2.
web中大量新闻网页、博客、电子邮件等非结构化信息中蕴含着大量的知识,对其进行处理以自动获得知识具有重要意义。目前,一些基于信息抽取等技术抽取简单关联关系的知识获取应用系统存在明显的局限性,本文引入Apache Stanbol——Apache下的一种从非结构化信息中自动获取知识的开源项目,它是一个为语义内容管理设计的模块化的软件集和可重用组件,旨在将传统内容管理系统(CMS)拓展为支持语义服务的语义内容管理系统(SCMS),在此基础上,为改善搜索引擎关于内容的搜索、分类,实体消歧及语义化查询等带来帮助。 相似文献
3.
情报关注模型的构建是实施网络科技信息结构化监测的前提,在网络科技信息情报价值判断、科技动态监测中发挥着重要的作用.本文以能源科技领域监测动态快报为基础,对情报人员关注的网络科技信息的特征进行分析,发现对象及其行为在情报价值判断中具有重要的作用,对象及其行为具有机构特殊性,领域重要机构的数量具有收敛性.在此基础上构建基于对象行为特征的情报关注模型,该模型不但关注对象本身,而且关注对象的行为以及行为背后的事件.对情报关注模型应用效果进行的评测和分析的结果表明,该模型可以有效提高网络科技信息情报价值判断的准确性和精细化程度. 相似文献
4.
针对档案信息资源共享的特点,采用有效的隐私保护技术实现档案信息的安全共享,防止敏感信息的泄露和被非法访问,已经成为当前国内外档案界一个亟待解决的课题。研究基于受限访问和自由访问的档案信息共享隐私保护的两种主流技术,并进行语义处理能力的分析;提出档案信息隐私保护的技术策略,一是以信息拥有者的隐私策略为研究对象,研究和实现基于策略的档案信息隐私保护技术,二是从知识和语义的角度研究信息匿名保护和隐私推理攻击的检测和防范,改进传统的匿名化隐私保护方法;采用基于知识技术的访问控制策略,研究档案信息共享隐私保护框架,使档案信息的共享安全具备智能处理的基础,在档案网站中的实践具有现实意义。 相似文献
5.
在现有研究的基础上,探索利用用户信息进行馆藏资源语义化的方法。首先,根据语义化揭示原理,构建基于用户信息的馆藏资源语义化模型,通过用户信息和信息计量分析挖掘图书之间、图书与用户之间、用户与用户之间的语义关系。然后,详细阐述基于用户信息实现馆藏资源语义化的具体过程,并进行数据实验。研究表明,利用用户信息来构建图书资源和用户之间的语义关系,是实现馆藏资源语义化的一种可行思路。 相似文献
6.
在前期研究基础上,文章致力于对计量分析与语义本体进行全面深入的类比分析,进而提出数字文献资源计量语义化理论框架;对基于计量分析的语义化机理与模式进行分解阐述,进一步构建系统化的数字文献资源计量语义化模型,该模型由数字文献资源元数据构建、信息计量与统计分析、计量语义化分析、计量语义知识提取与发现、计量语义化应用五个模块组成,具有易操作多功能、可扩展便推理、互操作广应用等特点. 相似文献
7.
随着互联网医疗的快速发展,数字经济和智能经济成为未来必然发展趋势,医学知识的语义化和规范化是实现智慧医疗和数字医学的重要手段。但现阶段较为成熟的医学本体仅仅描述了一些既定的静态知识,无法揭示医学知识之间的动态关联。因此,以知识表示和知识组织为出发点,构建符合叙事性文本特征的医学知识结构化表示方法具有十分重要的意义。本文在梳理叙事学理论、事件知识表示的基础上,按照是否具有叙事性特征,将医学文本分为叙事性文本和概念性文本;然后,分别对概念性医学文本和叙事性医学文本进行语义建模与表示,构建基于事件本体的医学知识本体模型;最后,根据本文提出的概念模型,实现SARS-CoV-2病毒入侵过程的语义结构化表示。初步标注的实验结果表明,将事件本体模型迁移到医学文本语义结构化描述中,有助于实现医学文本的深层次表示和知识发现,能更好地描述医学知识之间的动态关联,更好地表征医学对象在时间和空间的动态发展特点。 相似文献
8.
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。 相似文献
9.
10.
微博语义分析服务的价值在信息泛滥的微博时代,网上社区巨大的数据量已经超出了人力分析的极限,传统的媒体剪报、邮件列表已经不足以反映媒体对某项产品或服务的反应,基于语义分析的新闻服务成为媒体业务创新的方向.微博等社交网络中的文本一般都很琐碎,即所谓"非结构化信息",通常具有以下特征:对特定对象非常有价值,但数据量很小而且非常分散;数据量庞大信息泛滥;在广度和深度上都非常复杂且缺少元数据,无法转换成可以使用的结构化格式. 相似文献
11.
数据与数据之间通过富含语义链接的方式形成了有价值的数据网络,在以语义网为核心的网络架构中,网络资源的语义化结构、细粒度描述、数据关联等特性对数据加工及利用提出了新的挑战,信息组织的处理对象及外延发生着变化,信息组织工具不断丰富且功能趋于统一。本文依据信息组织的不同功能和处理流程可以将其细分为资源层、元数据记录层、词表层,分别对各个层次的特点、变化及其未来发展进行分析,认为从文本中准确提取出反映语义含义的特征项是当前信息组织的关键问题,元数据集、知识组织系统成为词表的主要构成,知识组织系统呈现出描述对象概念化、语义关系多样化、描述语言形式化、数据开放关联性四大特点。图3。参考文献23。 相似文献
12.
13.
Bevan Koopman Guido Zuccon Peter Bruza Laurianne Sitbon Michael Lawley 《Information Retrieval》2016,19(1-2):6-37
This paper presents a Graph Inference retrieval model that integrates structured knowledge resources, statistical information retrieval methods and inference in a unified framework. Key components of the model are a graph-based representation of the corpus and retrieval driven by an inference mechanism achieved as a traversal over the graph. The model is proposed to tackle the semantic gap problem—the mismatch between the raw data and the way a human being interprets it. We break down the semantic gap problem into five core issues, each requiring a specific type of inference in order to be overcome. Our model and evaluation is applied to the medical domain because search within this domain is particularly challenging and, as we show, often requires inference. In addition, this domain features both structured knowledge resources as well as unstructured text. Our evaluation shows that inference can be effective, retrieving many new relevant documents that are not retrieved by state-of-the-art information retrieval models. We show that many retrieved documents were not pooled by keyword-based search methods, prompting us to perform additional relevance assessment on these new documents. A third of the newly retrieved documents judged were found to be relevant. Our analysis provides a thorough understanding of when and how to apply inference for retrieval, including a categorisation of queries according to the effect of inference. The inference mechanism promoted recall by retrieving new relevant documents not found by previous keyword-based approaches. In addition, it promoted precision by an effective reranking of documents. When inference is used, performance gains can generally be expected on hard queries. However, inference should not be applied universally: for easy, unambiguous queries and queries with few relevant documents, inference did adversely affect effectiveness. These conclusions reflect the fact that for retrieval as inference to be effective, a careful balancing act is involved. Finally, although the Graph Inference model is developed and applied to medical search, it is a general retrieval model applicable to other areas such as web search, where an emerging research trend is to utilise structured knowledge resources for more effective semantic search. 相似文献
14.
15.
16.
17.
科学数据和信息是重要的科技资源,是科技创新活动的重要基础和工具。科学数据和信息是国家科技基础
条件平台建设体系中非常重要的一类资源,加强科学数据和信息资源管理与共享研究,是推进科技平台建设的重要理
论基础。本文在对比分析国外科学数据和信息资源管理与共享现状的基础上,系统总结了我国在科学数据和信息管理
和利用方面取得的主要工作成效,提出完善制度体系和管理机制、推动数据中心建设、加强数据和信息全生命周期管
理等意见和建议 相似文献
18.
��[Purpose/significance] The abstract of scientific papers is a vital indexing object within information organization. Meanwhile, indexing the abstract according to certain rules is conducive for not only scientific communication or knowledge discovery, and intelligence analysis as well. Thus, how to realize auto-index accurately and quickly, for millions of unstructured abstracts existed nowadays is a crucial problem to be addressed.[Method/process] This study assumed that different categories of abstract are inherently consistent, that is, the study of structured abstract can provide a method and technical reference for unstructured abstract auto-indexing. Acting in accordance with this assumption and based on the US National Library of Medicine's structural element labeling terminology, this study accomplished mapping across abstract element classifications and proposed BOMRC system, a normalization indexing method for structured abstract. Then we collected research sample and used text mining method to analyze multiple features of structured abstract quantitatively and statistically, such as word frequency, TF-IDF value, as for dimension of words, verbs, three-word lexical chunks and four-word lexical chunks, which enabled us propose a semantic feature dictionary for structured elements. Finally, we used unstructured abstract to test the validity of the semantic feature dictionary.[Result/conclusion] The results show that the semantic feature dictionary method can effectively identify various structural elements of scientific paper abstract, and it can be used to optimize the automatic recognition model, which may be based on machine learning methods. 相似文献