首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
在分析大数据环境下商业银行审计非结构化数据特点的基础上,结合当前大数据领域处理和分析非结构化数据的主流技术,提出商业银行审计云平台构建过程中在非结构化数据应用分类、采集存储、处理分析等方面的数据规划标准,为大数据环境下规范商业银行非结构化数据审计提供参考。  相似文献   

2.
大数据环境下微信公众平台非结构化数据融合研究   总被引:1,自引:0,他引:1  
微信公众平台具有开源、发布及时的特点,目前它已经成为各机构发布信息的重要渠道。但这类数据又具有非结构化、无语义描述的特点,如何将微信公众平台从非结构化数据转化为可分析、判断的结构化数据,成为一个亟须解决的问题。针对该问题,本文提出一个对微信公众平台结构化数据监测的层次体系。这一方法将通过数据融合方式,从平台资源中抽取数据,构建结构化数据库,进行权重比较,判断情报价值,进而实现对研究领域的态势监测。  相似文献   

3.
介绍了为实现网络办公自动化,使用数据库开发工具PowerBuilder处理基于关系数据库的传统结构化数据和以文件、报表、信函等形式为载体的非结构化的复合文档数据的开发实例。  相似文献   

4.
非结构化数据随着信息时代的发展呈现爆炸式增长,非结构化数据存取的难点在于数据没有非常统一的规律便于系统查询和访问。传统的非结构化数据存取方法沿袭了结构化数据存取的方法,通过建立相应的特征关键字进行存取,由于非结构化数据的模糊特征性,对大量数据的兼容性很差。提出了一种非结构化数据的多牵度分配存取实现方法,将数据特征提取,根据特征将数据存储在不同的牵度区域,在数据合成时,通过牵度索引,建立不同的数据拼接顺序,从而实现很好的数据恢复。通过实际的海量数据进行测试实验,结果显示,采用多牵度分配存取的方法,非结构化数据的存取速度大大提高,具有很好的应用价值。  相似文献   

5.
浅析大数据     
说明了什么是大数据和大数据的重要性,介绍了大数据的可视化分析,并从数据准备、结构化数据和非结构化数据等3方面介绍了大数据的处理。  相似文献   

6.
王志丽  孙宝 《现代情报》2009,29(3):87-89
针对数字图书馆中的图像、视频、音频等无结构化数据的集成问题,提出了语义对象模型的概念,实现无结构化数据的统一全局对象表示。在此基础上,提出了一种以XML数据模型为基础的无结构化数据集成方法。  相似文献   

7.
本文以国家科技计划经费管理信息系统的应用实践为背景,提出多样性电子数据的采集及储存管理等技术,结合XML应用、文档处理、PDF合成等结构化数据与非结构化数据的转换研究,提高了数据采集效率,改善了电子数据的处理方式,从而满足电子政务对多样数据内容管理的处理要求。  相似文献   

8.
随着互联网技术与金融业务的融合发展,当前金融欺诈呈现出"专业化"、"集团化",导致企业在风险处置上花费较多的成本;此时大数据风控技术应运而生,该技术就是利用结构化数据、半结构化数据和非结构化数据,通过数据采集、实时\非实时数据加工等技术手段,结合各类风控模型,识别出风险客户,从而降低企业运营成本。经过艰苦的开发,系统已经建立起以实时\非实时数据集市为基础,数据采集和为依靠,规则引擎为载体的体系,有效降低各类风险的冲击。  相似文献   

9.
本文阐述了利用XML将半结构化Web数据转化为结构化的XML数据,介绍了目前Web数据抽取的最新技术及特点,并对无监督学习网页重复模式发现网页内在模板抽取方法进行了深入的研究和探讨。  相似文献   

10.
文本中实体关系的确定可以使计算机清楚文本中实体间的联系,进而可以通过其中一个实体和关系得出另一个实体,关系抽取技术用于抽取文本中实体之间的关系.随着互联网技术的发展,文本数据越来越庞大.关系抽取作为信息抽取的子任务,帮助人类从海量数据中获取有用的信息,实现将非结构化、半结构化的自然语言文本转化为结构化数据.在介绍关系抽...  相似文献   

11.
针对传统的微博聚类分析中,只单独针对微博阅读数、评论数等数据(下称微博结构化数据)进行分类或者单独针对由微博内容进行文本分词得到的分词数据(下称微博分词)进行分类的问题,本文采用了Kohonen聚类,研究结合微博结构化数据和微博分词的融合数据聚类的效果是否比单独对微博结构化数据或对微博分词聚类有所提高。实证数据实验结果显示,微博结构化数据单独聚类会出现一个类的标准差特别大(本文称为离群类),而对融合数据聚类,微博结构化数据则不会出现离群类;融合数据聚类结果对微博分词的影响不显著。  相似文献   

12.
随着大数据时代的来临,审计作为一个综合的经济监督部门也必将面临其带来的巨大挑战,在企业系统中产生了海量的非结构化数据,仅靠人工进行审计,成效杯水车薪,针对非结构化数据的审计已经成为审计业务的盲区,利用高科技手段与工具实现非结构化数据的分析与挖掘为审计业务提供数据支撑的需求已迫在眉睫。本文基于文本挖掘技术,采用信息抽取方法从非结构化文档中提取关键信息,进行结构化存储,然后进行自动稽核,既大大减少因人工操作耗费的大量人力、财力成本,又避免了因人为疏忽造成审计问题遗漏的情况,更加全面的审计各种问题。  相似文献   

13.
正为了应对大型企业对非结构化数据的合理管理和有效应用两个方面要求,设计了非结构化数据管理系统平台,分析该系统平台的设计架构、接口设计、功能设计和主要功能模块。该系统可用于对企业各类非结构化数据的有效全生命周期管理,并拥有更好的客户体验,能够最大限度的贴合企业内容管理的特点,支持大规模,集团型的知识管理需求。非结构化数据是企业重要的信息资产,如何安全的存储非结构化数据,并将之高效的利用,是企业经常面对的难  相似文献   

14.
提出了基于前缀编码的模型映射改进方法,实现了XML半结构化数据到关系数据库的映射,从而为将半结构化数据管理转化为传统关系数据库管理奠定了基础。  相似文献   

15.
《科技风》2021,(14)
大数据时代,数据存在形态多种多样且呈半结构化,非结构化。传统的数据处理思想、方法和手段稍显不适用,统计学人才培养应该着眼现在考虑未来满足社会需求。本文针对当前统计学人才培养现状分析,结合大数据背景,给出统计学专业人才培养的一些合理建议,力求为统计学人才培养提供服务。  相似文献   

16.
介绍了在异构网络上如何运用Z39.50的一些方法检索全文,图像和多媒体信息。这些方法包括基准应用、结构化数据的发送、结构化数据的请求和服务器的解释等。  相似文献   

17.
分析了医院信息系统存在的问题和数据需求,依据结构化和非结构化数据的特点和要求,采用适合的存储技术和建设方案,以达到数据双副本和同步的基本要求。  相似文献   

18.
李白 《科技风》2024,(8):1-3
尽管现代照明技术在煤矿井下得到广泛应用,但由于信息碎片化和内容繁杂,导致大量数据和知识未能充分利用。为解决这一问题,本文构建了基于本体的煤矿井下照明知识图谱。通过定义核心概念、关系和属性,进行知识建模,然后利用命名实体识别、关系抽取和属性抽取将非结构化数据转化为结构化数据。最后,使用Neo4j图数据库存储知识,实现了煤矿井下照明知识图谱的构建。该图谱提高了数据整合和管理效率,为煤矿行业数字化转型提供了有力的知识支持。  相似文献   

19.
向禹  吴世明 《现代情报》2014,34(6):75-78
通过建设双层PDF全文数据库、创建索引和全文检索等实现过程来阐述相关技术的研究和运用。以建设全文数据库为基础,研究结构化信息与非结构化数据的合并管理,对目录数据和全文数据的同步索引,基于Lucene技术,实现档案管理系统的一站式智能化档案全文检索,提升档案查全率。  相似文献   

20.
阐述了数据预处理技术中的数据转换、数据集成等方法,建立了中医症状术语体系数据库,为专业领域术语体系库的建立提供了可行方案,亦为日后数据分析与挖掘所需的规范化和结构化数据集的产生奠定基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号