共查询到20条相似文献,搜索用时 46 毫秒
1.
Web是知识管理系统(KMS)信息采集的重要来源之一,但其数据的庞杂无序和半结构化特性给信息采集工作造成了一定难度.文章对Web信息采集机制,特别是HTML结构特征分析法进行了探讨,并结合采集机制研究,以建立企业名录信息库为例,说明采集系统如何最大限度地提高KMS基础信息采集的能力. 相似文献
2.
针对现实中企业远程信息处理中出现的滞后性问题,根据数字时代信息处理的特点与趋势,从信息真伪责任、信息传输方式、企业总部信息处理、异地信息采集、档案管理、情报处理专业代理等方面进行了探讨,旨在对企业情报处理提供有益建议。 相似文献
3.
针对现实中企业远程信息处理中出现的滞后性问题,根据数字时代信息处理的特点与趋势,从信息真伪责任、信息传输方式、企业总部信息处理、异地信息采集、档案管理、情报处理专业代理等方面进行了探讨,旨在对企业情报处理提供有益建议。 相似文献
4.
主要介绍了我们设计的Web主题信息采集系统的一项核心工作——Web信息主题的识别,主题识别算法从构造专业性较强的主题词典着手,充分分析和考虑Web网页文本的特点,从而大大提高了主题信息采集的效率和精度,该算法同样适用于其他领域的主题信息识别。 相似文献
5.
6.
面向主题的网络竞争情报采集系统* 总被引:7,自引:0,他引:7
分析Web页面的主题特征,构建基于主题的竞争情报采集模型的框架,详细论述面向主题的信息采集策略和采集流程,进而探讨影响信息采集质量的关键因素。 相似文献
7.
高校图书馆的数据挖掘技术应用与用户研究 总被引:12,自引:0,他引:12
数据挖掘技术是一种新兴的信息处理技术。本文列举了数据挖掘技术在图书馆信息采集、信息服务方面的应用,并对用户如何使用数据挖掘技术和方法提出了新的见解。 相似文献
8.
基于RSS的Web新闻主题聚合系统的设计与实现 总被引:5,自引:0,他引:5
钱爱兵 《现代图书情报技术》2007,2(4):56-61
基于RSS的Web新闻主题聚合是信息处理领域内的一个新兴且有实用价值的方向。分析Web新闻主题聚合的基本问题,提出难点以及相关的解决方案,并在此基础上设计Web新闻主题聚合系统。 相似文献
9.
文章针对目前我国农产品物流存在的问题,从信息采集、信息处理、信息利用等角度出发,设计了农产
品物流信息平台的总体架构,并讨论了如何运用电子政务对信息平台进行管理,提出相应对策。 相似文献
10.
Streaming Media流媒体技术在数字图书馆中应用 总被引:4,自引:0,他引:4
毛垣生 《现代图书情报技术》2003,(4):84-86
数字图书馆建设中面临的多媒体信息处理难题 ,Web多媒体新技术 -流媒体技术 ,使用三种流媒体技术应用解决方案 ,并进行多方面的比较 相似文献
11.
将语义网技术同传统的信息检索技术相结合,给出基于本体的Web信息采集框架结构,提出利用主题本体及对应词典判断主题相关度的方法,并得出实验结果和评价。 相似文献
12.
主要介绍了设计开发Web主题信息采集系统的一个核心算法——超链接主题预测算法。文章在已有理论的基础上,通过实验分析,发现超链接的主题主要取决于三个因素:父网页的主题相关度、锚文本的主题相关度和Web子图的链接结构特性,从而提出了基于Web页面内容和链接结构的超链接主题预测算法,系统评价结果显示该算法有很好的效果。 相似文献
13.
在数字图书馆Web 学术信息资源的优化采集中,有效结合网页空间特征、内容特征和标签信息对网页进
行分块,研究对分块结果进行识别和合并,然后输出网页的主题文本和相关链接块集合,最后通过实验分析该方法能
够进一步去除页面中噪音、准确地分析页面的主题相关性和提高Web 主题信息采集的质量。 相似文献
14.
Web数据挖掘及其在数字图书馆中的应用 总被引:4,自引:0,他引:4
刘丽 《中国科技资源导刊 (中国信息导报)》2003,(12):37-38
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是有用的信息和知识的过程。Web数据挖掘是数据挖掘技术在网络信息处理中的应用。它是从Web资源中抽取有用信息或知识的过程,是对Web资源中蕴涵的、未知的、有潜在应用价值的模式的提取。Web数据挖掘技术是一项综合技术,涉及Web技术、人工智能、计算机语言学、信息学、统计学等多个领域。 相似文献
15.
16.
在分析大数据时代农业信息资源特点的基础上,考察大数据技术在农业信息资源共享方面的利用价值,从农业信息处理的4个方面,即信息采集-信息存储-信息挖掘-信息利用,介绍大数据技术在农业信息资源共享中的应用。这有助于实现农业信息资源的有效开发与高效利用,加快农业信息化的进程。 相似文献
17.
18.
面向Deep Web的动态竞争情报智能采集策略 总被引:1,自引:0,他引:1
企业间竞争互动的高强度与高速度,突显出竞争情报的时效性,动态竞争情报是企业在复杂多变的环境下取得成功的关键.Web资源可分为surface Web和Deep Web.Surface Web由静态网页构成,Deep Web信息资源由动态页面、商业数据库、实时数据和企业内部数据库组成,具有质量高、实时性强、易于深度分析的特点,是企业动态竞争情报的重要来源,但常规网络信息采集工具不能直接获得这些信息.针对动态竞争情报采集中存在的信息源选择、信息抽取、信息分析中存在的障碍,提出面向Deep Web的动态竞争情报智能采集策略,详细探讨了动态数据源的智能选择、查询结果的智能抽取、智能化的数据集成和智能分析策略. 相似文献
19.
Web网页识别算法研究 总被引:7,自引:1,他引:6
WWW上的文本信息挖掘工作是网络信息处理领域的新课题。本文研究了两种机器学习算法———Rocchio算法和Widrow Hoff算法在Web网页识别领域中的应用 ,并对几种网页识别算法进行了比较分析 相似文献
20.
提出一种新颖的本体存储库系统体系结构,支持在大型开放企业环境中的语义信息共享。采用文档方式SOAP Web服务的松耦合机制实现应用程序、用户对本体的存取。系统使用本体Web服务(OWS)封装对本体的操作功能,支持概念的平滑转换,自动检验本体的完整一致性。原型实验显示系统对支持智能信息处理的可行性。 相似文献