首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
基于文本的信息过滤模型   总被引:1,自引:0,他引:1  
信息过滤技术用于帮助用户在动态信息流中过滤出用户感兴趣的信息。通过对信息过滤概念的阐述,抽象出这类系统的一般模型。介绍了布尔模型、向量空间模型、潜在语义索引模型和神经网络模型等四种信息过滤模型,并就其特点进行了分析。  相似文献   

2.
通过对开源网络爬虫Heritrix的系统构架进行改进,设计基于关键词过滤的主题网络爬虫,并提供一种配置手段利用HTMLParser技术对抽取内容进行结构化分解。实验结果表明,这种对Heritrix改进从而实现的网络爬虫,能够有效地按关键词过滤信息内容,并对信息主体进行了结构化存储。  相似文献   

3.
论文对国家标准《文件管理元数据原则》中文件管理元数据的结构化信息与半结构化信息的定义、由来及其如何理解进行了探讨,并对作为典型的结构化信息的《都柏林核心元数据集》进行了辨析,同时,对文件管理元数据的半结构化信息进行了辨析,最后指出了文件管理元数据的结构化信息与半结构化信息的意义所在.  相似文献   

4.
非结构化数据对组织发展的作用越来越重要,其数量占比为90%以上。非结构化数据对图书馆的信息挖掘和学科服务具有重要的支持作用,以高校图书馆为例,其非结构化数据的主体、内容体系、流向、数量、价值等体现出鲜明的特性。文章以大数据的信息内容为基础,构建了非结构化大数据的D-SFSD管理模式,通过界定适用于高校图书馆的大数据信息属性特征,使用五因素评价矩阵量化分析大数据的优劣,对适合高校图书馆战略发展的大数据进行优化组织与分级管理。  相似文献   

5.
通过对开源网络爬虫Heritrix的系统构架进行改进,设计基于关键词过滤的主题网络爬虫,并提供一种配置手段利用HTMLParser技术对抽取内容进行结构化分解。实验结果表明,这种对Heritrix改进从而实现的网络爬虫,能够有效地按关键词过滤信息内容,并对信息主体进行了结构化存储。  相似文献   

6.
魏浩 《图书馆学刊》2005,27(1):81-83
图书馆面临着如何有序地存储、管理并利用大量的、非结构化信息的问题.本文从信息门户理论出发,讨论了在图书馆信息管理领域对非结构化数据进行管理活动所面对的问题与解决途径,以及由此产生的利弊.  相似文献   

7.
在图书馆信息门户中管理非结构化数据   总被引:1,自引:0,他引:1  
魏浩 《图书馆学刊》2005,27(1):81-83
图书馆面临着如何有序地存储、管理并利用大量的、非结构化信息的问题。本文从信息门户理论出发,讨论了在图书馆信息管理领域对非结构化数据进行管理活动所面对的问题与解决途径,以及由此产生的利弊。  相似文献   

8.
图书馆面临着如何有序地存储、管理并利用大量的、非结构化信息的问题。文章从信息门户理论出发,讨论了在图书馆信息管理领域对非结构化数据进行管理活动所面对的问题与解决途径,以及由此产生的利弊。  相似文献   

9.
大数据环境下高校图书馆非结构化数据融合分析   总被引:1,自引:0,他引:1  
大数据环境下,高校图书馆非结构化数据蕴含的信息越来越多,其对图书馆的数据挖掘和学科服务具有重要的支撑作用。文章对高校图书馆的非结构化数据特性进行分析,将其分为同型异源数据、异型异源数据、同型同源数据三种,构建了非结构化数据的融合分析流程,适合高校图书馆非结构数据的挖掘和管理。  相似文献   

10.
数据新闻是什么?数据新闻所定义的数据不仅仅是数字,还可以是文字、图片、时间、关系和地理坐标等,概括地说,它们都是结构化信息。要注意的是,你的电脑装不下的数据,才勉强能称之为大数据。因此,目前一般在媒体、新闻领域所接触的数据都不涉及大数据这个概念。  相似文献   

11.
数字图书馆运用计算机系统管理各种载体文献的加工与服务,通过网络和通信技术支持用户访问数字化文献信息资源。数字图书馆对海量数据的处理能力是保证数据质量、支持与深化数字图书馆服务功能的基础。文章论述数字图书馆中数字文献再处理工具研究的重要性,介绍和阐述已有工作的开展情况,以及结构化的数字文献再处理工具的开发与实践工作。  相似文献   

12.
半结构化数据的特点有 :隐含的模式信息 ;不规则的结构 ;模式信息量大 ;模式变化快 ;先有数据 ,后有模式 ;模式是用于描述数据的结构信息 ,而不是对数据结构进行强制性约束 ;没有严格的类型约束 ;结构不完全。参考文献 13。  相似文献   

13.
信息在当今社会的地位可谓举足轻重。它早已成为企业生存和发展的一个主要关键。各行各业都在关注信息、技术的发展并积极采用现代化信息手段提高经济效益,增强市场竞争的活力。在信息产业中发展最快的热门行业之一,当属“建筑及建筑群结构化布线系统”。它为语音、图文、数据、图象等综合信息传递提供了安全可靠、平坦宽敞的高速公路。同时,它也是企业内部局域网的基础平台。 在我国自进入90年代,以综合布线系统为基础的智能大厦开始发展并逐步升温,结构化布线系统越来越广泛地被应用在大型建筑及建筑群上。目前,在国内市场上各  相似文献   

14.
非结构化数据库在数字化图书馆发展中的应用   总被引:6,自引:0,他引:6  
擅长于处理结构化数据的关系数据库已渐渐适应不了数字化图书馆的发展需要.因此基于网络应用的非结构化数据库应运而生。文章根据非结构化数据库的特征,论述了它在数字化图书馆发展中为数字信息资源建设提供技术支持及在开展各层次信息服务等方面的应用。  相似文献   

15.
[目的 /意义]推荐算法技术快速发展所产生的“过滤气泡”现象给用户信息行为带来深刻的影响。从用户角度出发,对其面对过滤气泡时的行为类型以及行为产生的机制进行探索性研究,帮助用户建立对过滤气泡现象的理性认知,为信息服务平台明确推荐算法的建设方向、改进服务水平提供一定的参考。[方法 /过程]采用扎根理论,选取对互联网信息服务平台有一定使用经验的30位用户进行半结构化访谈,并进行编码分析,构建用户面对过滤气泡时的行为与形成机制模型。[结果 /结论 ]用户面对过滤气泡时的行为类型主要包括忽略行为、缓解行为、加强行为、突破行为以及脱离行为。感知控制、态度和信息需求直接影响用户面对过滤气泡时的行为;推荐算法通过态度以及感知控制的中介作用对行为产生影响;此外,个人特质对行为产生的全过程起到调节作用。对特定情境下用户信息行为的研究以及进一步探究过滤气泡现象提供了一种研究视角和研究基础。  相似文献   

16.
网络信息过滤系统研究   总被引:22,自引:0,他引:22  
黄晓斌  邱明辉 《情报学报》2004,23(3):326-332
网络信息过滤是根据一定的标准和利用一定的工具从动态的网络信息流中选取相关的信息或剔除不相关信息的一系列过程。本文论述了网络信息过滤的原理 ,概述了网络信息过滤系统的主要类型 ,分析网络信息过滤软件的结构和功能、介绍了过滤软件的评价与选择方法  相似文献   

17.
马兴涛  席欣 《信息系统工程》2011,(7):111-112,110
随着信息技术的不断发展,传统中结构化数据一统天下的局面正在发生着深刻的改变,由于非结构化数据能更加逼真、生动的展示事务的状态,大量的非结构化数据正越来越多的受到人们的关注、被人们使用。由此也出现一些问题,其中如何有效的管理这些非结构化数据,就是一个亟待解决的问题。本文通过对远程文件存储技术RBS的一些分析和研究,试图找到一个比较好的解决方案,来对大量非结构化数据进行有效的管理。  相似文献   

18.
顾涛 《电子出版》2002,(5):26-26
SGML将信息作为结构化的数据,而不是纸上的文字加以管理。因此,SGML能够克服与印刷文件相关的一系列困难问题:印刷出版之后,信息流的截断(印刷版的信息不能轻易地改变或更新);与数据源无法连接;印刷出版信息很快就过时;难以进行管理。  相似文献   

19.
现有电子档案中存在大量的非结构化档案数据,是非常普遍的现象。由于非结构化电子档案数据具有彼此孤立且兼容性差特征,因而对非结构化电子档案的管理一直是电子档案工作所要解决的重要内容之一。本文结合电子档案管理实际情况,对非结构化档案数据产生的环境、特点以及管理的技术方法进行分析和梳理,以期更好的配合对国家档案局发布的《电子档案移交与接收办法》的解读和实施。  相似文献   

20.
信息技术的发展,现有电子档案中的非结构化档案数据出现的越来越多了,对传统的档案管理工作提出了更多的要求,由于非结构化电子档案数据具有彼此独立的特征,那么对非结构化电子档案的管理也就成了电子档案工作所要解决的重要内容之一。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号