首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
基于HTML或MXL描述的Web页信息抽取技术研究   总被引:1,自引:0,他引:1  
谢维成  吕先竞  宋玉忠 《情报科学》2005,23(9):1398-1402
从同类企业挖掘有价值的信息是企业信息化的重要任务,目前Web企业信息描述大多数是用HTML表示的,但基于XML描述的企业信息Web页面逐渐增加,Web数据抽取是Web企业信息挖掘的关键,本文提出了一种面向HTML和XML描述的Web页面的Web数据抽取模型并阐述了实现过程。  相似文献   

2.
一种基于XML的Web信息抽取方法   总被引:6,自引:2,他引:4  
目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web信息抽取技术。在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法。  相似文献   

3.
阐述了针对中小型企业供需信息自动化Web信息抽取技术的研究。自动化是指不需要人工标注网页抽取规则学习样本,系统能够从不同的求购信息网站的网页里自动获取相应的信息抽取规则,通过引入领域特征来净化抽取到文本字段而获得较高的查准率。  相似文献   

4.
李建 《科技广场》2006,(8):33-36
本文前部分主要就XML Web Services的概念、发展状况、体系结构,以及Web服务中的一些主要标准和协议做了一定的介绍,后部分则比较详细地讲述了在.NET框架下开发XML Web服务过程中一些常用技术的使用。  相似文献   

5.
随着互联网的快速发展,Web信息抽取技术的研究及应用已越来越多,本文介绍了Web信息抽取技术的概念及国内外的发展历程,分析了Web抽取信息的原理;对目前主流的Web信息抽取技术进行了归纳分析,阐述了Web信息抽取的评价指标。  相似文献   

6.
针对当前高校信息平台的特点和现状,详细探讨了基于.NET框架的网络学习系统模型的设计的整个过程。应用Web服务技术,解决了服务参与业务流程,数据共享,服务安全调用,跨平台跨语言交互等关键问题。  相似文献   

7.
Web抽取技术是众多对网络信息资源挖掘中重要的一项技术。近年来,Web抽取技术发展很快,已渗透至各个领域,应用到很多行业,但真正涉及陶瓷产品应用这一块的不多,本文在分析了Web抽取技术现阶段发展现状的基础上,针对陶瓷产品的特点提出了陶瓷产品信息Web抽取的技术路线,以便获得和整理陶瓷产品信息,规范陶瓷产品的信息资源。  相似文献   

8.
基于Microsoft.NET平台的ASP.NET技术   总被引:2,自引:0,他引:2  
介绍了微软下一代开发平台Microsoft.NET的技术框架,分析了ASP.NET的技术特点及其实现方式,说明ASP.NET开发环境能创造出更加动态、伸缩性更强的Web应用程序。  相似文献   

9.
基于Web资源的信息抽取技术   总被引:7,自引:0,他引:7  
郭志红 《情报科学》2002,20(12):1282-1284
Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。如何将这些信息抽取出来,转化成结构化信息供其它信息集成系统所利用,成为该领域的研究热点。本文介绍了一个简单的Web信息抽取模型,对于基于该模型的wrapper归纳技术进行了探讨,并描述了一个wrapper自动生成系统的原型。  相似文献   

10.
目前的Web信息抽取技术中,基于内容方式又需要复杂的语言知识和自然语言处理技术。如何将基于结构方式和基于文本方式有效的结合起来克服各自的缺点。  相似文献   

11.
基于HTMLParser对网页进行解析,可抽取标签间的Link、image、meta和title等信息。使用HTMLParser来提取Web文献中的题名、关键字、摘要、作者、来源等信息,清洗后存入MySql数据库当中,以备后续数据挖掘使用。对此进行了论述。  相似文献   

12.
姚栋 《科技广场》2012,(1):123-126
本文针对.NET平台的技术特点,结合社交网站设计思路与常规的网络店铺结构理念,设计了一种集休闲娱乐于一体的新网络店铺模式,解决了传统店铺功能单一、安全性低等问题,易于开发实现并且系统稳定性强。软件测试结果表明,基于.NET平台设计的网络店铺管理系统能实现功能的多样化,并有效解决数据的冗余、重复问题,系统运行正常。  相似文献   

13.
分析了现有各级教学资源信息化工作中出现的问题。通过调研,提炼出教学资源信息平台的主要业务功能需要。在此基础上提出了基于XML和ASP.NET的教学资源信息平台设计方案,并详细论述了基于SOA的用户身份验证、基于XML的教学资源规范化描述以及XML文档在SQL Server中的存储方式和读写访问等实现过程中的关键技术。  相似文献   

14.
随着互联网技术兴起,人类信息积累速度越来越快,对网页信息自动抽取的需求随之变大。本文对现今网页信息扫描和抽取特点进行分析,对其存在的问题给予阐述,并结合PHP语言,解析如何运用其相关技术对网页信息实现企业级别的精确提取。  相似文献   

15.
研究的是在特定领域提取概念本体,以本题库作为知识管理的基础,再通过语义网OWL技术和本体技术对知识单元进行集成,通过构建敏感信息本题库,以本体和分布式技术为基础,通过语义推理来研究信息过滤系统。  相似文献   

16.
Web程序的广泛应用也对Web程序本身提出了更为严格的要求,特别是在安全性方面,身份认证作为Web应用程序安全的一部分,也给人们提出了新的思考。本文就如何使用ASP.NET中的MemberShip实现身份认证给出了一个方法,并对ASP.NET中的身份认证功能做了一些改进。  相似文献   

17.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号