首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
刘平兰 《情报杂志》2002,21(11):37-38
针对万维网上用于表达Web页面信息的HTML语言存在的缺点,提出了一种基于DOM的数字图书馆Web资源信息提取服务模型,即以文档对象模型DOM为基础,把所要提取的信息在DOM层次结构中的路径作为信息提取的“坐标”,设计了一种归纳学习算法来半自动地生成提取规则,然后根据提取规则生成Java类,生成的Java类可以作为Web包装器软件的重要组成部分。此模型是研究异型数据源系统中组合查询处理的重要组成部分。  相似文献   

2.
基于XML技术的动态网站使用XMLHTTP对象在浏览器和服务器端之间交换XML文档,接受数据端可以使用DOM、XSL等XML相关技术对XML文档进行相应的处理。  相似文献   

3.
贾素来 《大众科技》2007,(10):70-71
基于XML技术的动态网站使用XMLHTTP对象在浏览器和服务器端之间交换XML文档,接受数据端可以使用DOM、XSL等XML相关技术对XML文档进行相应的处理.  相似文献   

4.
朱学芳  冯曦曦 《情报科学》2012,(7):1012-1015
通过对农业网页的HTML结构和特征研究,叙述基于文本内容的农业网页信息抽取和分类实验研究过程。实验中利用DOM结构对农业网页信息进行信息抽取和预处理,并根据文本的内容自动计算文本类别属性,得到特征词,通过总结样本文档的特征,对遇到的新文档进行自动分类。实验结果表明,本文信息提取的时间复杂度比较小、精确度高,提高了分类的正确率。  相似文献   

5.
协同设计中基于XML的产品信息模型的研究   总被引:1,自引:0,他引:1  
提出了XML描述的产品设计信息文档模型以及XML文档信息交互处理的方法;并以机械设备喷射泵的协同设计为例,在基于XML文档树模型和模式的中小企业产品异地协同设计的原型系统中,实现了产品数据资源的浏览与交互处理的统一描述;采用传输XML表达的设计语义而不是三维实体造型的数据交换方法,在减轻网络负荷的同时,满足了协同设计中实时、同步的产品显示与造型的需求。  相似文献   

6.
《今日科苑》2008,(10):197
XML是一种中介标示语言(Meta-markupLanguage),可提供描述结构化资料的格式,是能够进行自解释(SelfDescribing)的语言。XML使用DTD(Document Type Definition文档类型定义)来显示这些数据,而用XSL(eXtensible StyleSheet Language)来描述这些文档如何显示的机制,XSL是XML的样式表描述语言。由于XML能够标记更多的信息,所以它就能使用户很轻松地找到他们需要的信息。XML是一种开放的、以文字为基础的标记语言.它以一种简单并标准的传输方式存储原始数据.本文以VB为例,阐述了什么是DOM,以及如何通过文件对象模型(DOM)读取XML文件,并浏览其内容.  相似文献   

7.
张令通  罗森林  陈燕颖 《科技通报》2014,(3):108-112,125
为降低进行文档搜索时对系统资源的占用,提出了一种实现对主机内文档进行快速高效搜索的方法,采用基于宽度优先非递归搜索算法实现对主机内文档的遍历搜索;采用基于改进的BF算法和改进的KMP算法分别进行文档名和文档关键词匹配;采用降低线程优先级和定时暂停程序的方法控制搜索效率;采用压缩存储的方法对搜索结果进行处理。设计并实现了原型系统,测试结果表明,系统具有较高的准确率和召回率,且对主机内存、CPU、硬盘等资源占用少,降低了在进行文档搜索时对计算机其他进程的影响。  相似文献   

8.
信息采集中Web文档模型的表示是影响采集精度的重要因素之一。本文通过LIRA系统对用户的信息需求进行目标表示,对Web文档模型结构进行分析,提出基于该模型的特定领域目标信息预测采集控制方法,并通过用户自学习实验给出该模型的优化指标。  相似文献   

9.
近年来,我国资源陆地卫星遥感技术取得很大进步,但卫星遥感应用在各方面、各层级还存在一定的提升空间.其中,传感器校正产品质量的稳定性和精细化处理能力一直是制约遥感卫星数据高水平应用的瓶颈. 在国家重点研发计划项目、国家自然科学基金项目及横向课题的支持下,自然资源部国土卫星遥感应用中心等单位以提高遥感卫星应用效能为目标,突破立体影像间及全色、多光谱影像间局部系统误差校正、多源测绘立体影像融合提取数字地表模型(DSM)、合成孔径雷达(SAR)影像无底图自动纠正、高光谱影像条带噪声去除等关键技术,制定文档对象模型(DOM)数据生产、DSM数据生产、SAR影像DOM数据生产、高光谱影像反射率DOM生产的业务化生产流程,构建多源卫星遥感影像全自动精化处理系统,实现包括十几类国产遥感卫星在内的国内外主流遥感卫星数据的业务化生产,促进卫星遥感应用的高质量发展.  相似文献   

10.
基于信息计量学研究的目的,对Web信息资源规模范围的定量测度、Web信息资源变化情况的计量分析等问题进行了初步研究和探讨。同时,综述了有关Web文档及其网络链接所服从文献计量学分布模型的理论研究进展。  相似文献   

11.
【目的/意义】目前在多文档自动摘要方面,研究者们主要关注于获取多文档集合中的重要主题内容,提出的很多自动摘要方法在提高摘要代表性的同时却忽略了文档中的潜在主题。【方法/过程】针对于多文档自动摘要中存在的冗余度较高且不能全面反映主题内容的问题,本文提出了一种基于句子主题发现的多文档自动摘要方法。该方法将多篇文档转换为句子集合,利用LDA主题模型对句子进行聚类分析与主题发现,并通过word2vec训练词向量计算句子的相似度;最终在主题之下通过TextRank算法来计算句子重要性,并结合句子的统计特征生成多文档集合的摘要。【结果/结论】通过人工测评的结果表明,本文提出的多文档自动摘要方法在主题覆盖性、简洁性、语法性等方面都取得了不错的效果。  相似文献   

12.
韩毅 《情报科学》2003,21(12):1320-1322
数字图书馆在WWW上进行相应的信息展示与提供,基于HTML的文档标记使信息查寻遇到了很大的挑战。本文提出了基于XML的搜索引擎逻辑结构,并对其中的关键技术进行了研究,提出了对XML半结构化文档建立索引和查寻时采用的数据结构和算法,使得数字图书馆在WWW上开展深层次信息提供成为可能,并且也使图书馆原有的MARC信息资源能得到充分利用。  相似文献   

13.
Dublin Core元数据在文档描述中被广泛使用。文章首先对Dublin Core元数据进行简短介绍,然后阐述对数字文档进行检索的几种方法,最后通过实例比较这几种方法在基于Dublin Core元数据的文档检索中的效率。  相似文献   

14.
从用户的视角出发,分析了网络环境下期刊的矩阵效应与期刊用户行为模式的特征,由最小努力原则引入在线文档分享平台,从互动性、实用性和便捷性等方面对比了在线文档分享平台和传统期刊数据库平台的不同特征,在此基础上借鉴在线文档分享平台的互动性,构建了基于用户的期刊资源互动服务模型及平台。  相似文献   

15.
[研究目的]针对主流话题发现模型存在数据稀疏、维度高等问题,提出了一种基于突发词对主题模型(BBTM)改进的微博热点话题发现方法(BiLSTM-HBBTM),以期在微博热点话题挖掘中获得更好的效果。[研究方法]首先,通过引入微博传播值、词项H指数和词对突发概率,从文档层面和词语层面进行特征选择,解决数据稀疏和高维度的问题。其次,通过双向长短期记忆(BiLSTM)训练词语之间的关系,结合词语的逆文档频率作为词对的先验知识,考虑了词之间的关系,解决忽略词之间关系的问题。再次,利用基于密度的方法自适应选择BBTM的最优话题数目,解决了传统的主题模型需要人工指定话题数目的问题。最后,利用真实微博数据集在热点话题发现准确度、话题质量、一致性三个方面进行验证。[研究结论]实验表明,BiLSTM-HBBTM在多种评价指标上都优于对比模型,实验结果验证了所提模型的有效性及可行性。  相似文献   

16.
在对信息检索过程中,文档的属性信息是不确定性或者是不完全的,很难做出决策。基于此,提出将粗集理论应用于信息检索模型中,构造语料库的邻接矩阵,通过对扩展的特征项与文档的上近似集和下近似集的重叠程度的比较,来确定文档与查询的相关性,并通过相关度来对文档进行取舍。通过实验证明,该方法可以提高信息检索的准确率。  相似文献   

17.
杨镇海 《情报科学》2004,22(8):975-978,981
本文对比了信息模型和编程模型的四层体系,提出了从文档模式(DTD或Schema)到UML模型的映射规则.并在基于NewsML的新闻发布软件开发中得到了应用.  相似文献   

18.
基于SVM的多类文本分类研究   总被引:9,自引:0,他引:9  
基于统计学习理论.构建了SVM文本分类模型,并给出了模型参数的100自动选择算法,解决了以往参数靠经验确定的弊端。传统的文本分类系统不能处理一篇文档同属多类别的情形,论文将该情形归结为多类文本分类问题,提出二叉决策树SVM模型,并就农业机械化工程文档进行了实证分析。结果表明,该算法具有较好的分类效果。  相似文献   

19.
乔航  冯梦舟 《情报杂志》2006,25(8):69-70,73
XML为网上教育资源规范化和标准化提供了有效的解决方法。在研究现有的XML文档与教育资源进行数据转换的方法的基础上,提出了一种基于元素树的新的数据转换方法。  相似文献   

20.
随着光刻系统复杂程度的提升,传统基于文档的系统开发方法,在保持设计文档间一致性及变更影响分析的困难程度也越发提升。特别是光刻系统涉及不同学科的工程模型,这些模型在文档载体中,不能完整得体现整个系统模型的设计结果。故本文采用基于模型的系统工程MBSE开发方法建立数字系统模型弥补传统方法存在的问题。文中采用的建模语言为SysML、使用Cameo System Modeler作为开发工具。以光刻系统中的校准模块为例,描述了MBSE在光刻系统校准仿真中的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号