首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于语义挖掘的智能竞争情报系统研究   总被引:2,自引:0,他引:2  
语义挖掘是一种从非结构化数据中准确地提取有用信息和知识的新兴数据挖掘技术。利用语义挖掘对这些非结构化数据和信息进行智能采集、分析和处理,可以帮助企业快速建立起经济有效的竞争情报流程。本文融合语义挖掘的相关技术来探索竞争情报的智能采集与分析原理,构建了一个基于语义数据挖掘的企业智能竞争情报系统。  相似文献   

2.
从对大数据的处理技术的研究入手,对数据分析中的非结构化数据处理相关算法及数据可视化中涉及的相关技术和问题进行了阐述。通过大数据处理技术在审计上的应用研究,对大数据给审计带来的向"全量审计"和"持续审计"的变化进行了分析探讨,最后,分析了我国目前在大数据审计上存在的问题,提出驾驭大数据是信息智能化审计的关键。  相似文献   

3.
在分析大数据环境下商业银行审计非结构化数据特点的基础上,结合当前大数据领域处理和分析非结构化数据的主流技术,提出商业银行审计云平台构建过程中在非结构化数据应用分类、采集存储、处理分析等方面的数据规划标准,为大数据环境下规范商业银行非结构化数据审计提供参考。  相似文献   

4.
随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。  相似文献   

5.
文本挖掘在网络舆情信息分析中的应用   总被引:15,自引:0,他引:15  
网络舆情已成为社会情报的一种重要表现形式.挖掘技术为网上大量以非结构化数据形式出现的舆情信息分析提供了方法和技术支持.介绍了网络舆情的特点与作用,分析了文本挖掘技术的主要功能,提出网络舆情信息挖掘分析模型,并以实例说明文本挖掘在网络舆情分析中的应用.  相似文献   

6.
现代企业在应用商业智能收获效益的同时,也面临着许多的问题和挑战.在分析商业智能的技术体系、应用现状及存在问题的基础上,提出了成功实施商业智能的对策,包括避免与业务脱节,独立业务规则模块及构建业务规则引擎,整合结构化与非结构化数据,增强数据可视化功能以及重视非技术因素和策略等方面.  相似文献   

7.
大数据环境下微信公众平台非结构化数据融合研究   总被引:1,自引:0,他引:1  
微信公众平台具有开源、发布及时的特点,目前它已经成为各机构发布信息的重要渠道。但这类数据又具有非结构化、无语义描述的特点,如何将微信公众平台从非结构化数据转化为可分析、判断的结构化数据,成为一个亟须解决的问题。针对该问题,本文提出一个对微信公众平台结构化数据监测的层次体系。这一方法将通过数据融合方式,从平台资源中抽取数据,构建结构化数据库,进行权重比较,判断情报价值,进而实现对研究领域的态势监测。  相似文献   

8.
基于XML的网页数据挖掘   总被引:1,自引:0,他引:1  
随着Internet的迅速发展,使得数据丰富而信息贫乏这对矛盾显得日益突出,数据挖掘技术正是应了这一需求而结合了机器学习、模式识别、统计学、人工智能、神经网络等多学科而出现的一项新技术,基于Web的数据挖掘是数据挖掘技术在网络信息处理中的应用。本文叙述了Web数据挖掘的概念、分类、技术等,重点讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

9.
彭博 《情报杂志》2022,(8):156-162+178
[研究目的]实体间关联关系是知识的基本载体,对网络文物信息资源中实体关系进行抽取是大数据环境下进行文物知识发现、绘制文物知识图谱的前提,也是文物信息资源开发利用需要解决的重要问题。[研究方法]针对网络文物信息资源结构化数据标准详实、实体关系特征明确、语言描述规范等特征,从知识库中查询实体关系并依照规则进行实体关系标注,利用元数据标准进行实体关系对齐,使用预训练语言模型获取字符特征,应用深度学习有关方法获取语义特征,进行了非结构化文物信息资源实体关系的抽取。[研究结论]研究表明,在与其他预训练语言模型及深度学习方法的关系抽取对比实验中,该方法的综合效率相对较高,并根据实体关系分类的不同进行特征挖掘,为文物信息资源的研究与推广提供了有益的参考。  相似文献   

10.
<正>随着数字化时代的来临,"非结构化"数据(如多媒体文件、网页、音视频文件等)的存储管理和共享已成为各企事业单位业务必须解决的问题。解决不断增长的存储容量的同时,还必须做好存储、传输、共享大量的非结构化数据的问题。特别是需要对共享文件提供在线实时访问和编辑的业务。基于此,本文将介  相似文献   

11.
文章给出了一种结构化数据转化到图数据这种非结构数据的模型,能够将MySQL数据迁移到Neo4j中,借助可视化数据便于人们直观的发现数据间的关系,挖掘潜在的价值。  相似文献   

12.
流程挖掘是一种从实际业务执行日志中发现结构化流程信息的过程。流程挖掘技术广泛应用于业务流程的发现和辅助建模过程中,并能够通过差异分析的方法帮助改进已有业务流程。如何处理流程模型中的重复任务,是流程挖掘技术的一个关键问题。提出了一个在标准流程挖掘算法执行之前进行的重复任务处理阶段,这一重复任务处理方法可以很好地兼容目前已有的各种流程挖掘算法使之能够处理重复任务。并提出了一种能够将事件记录上下文信息的差别数值化的距离度量定义,使用这种度量能够利用聚类方法来识别输入数据中的重复任务。最后利用典型的带有重复任务的流程模型,对所提出的处理方法进行了模拟实验,并取得了良好的实验效果。  相似文献   

13.
基于IBASE的高校数字图书馆解决方案   总被引:1,自引:1,他引:0  
非结构化数据库能够处理无法用统一结构表示的信息.IBASE是基于非结构化数据实现的数据库管理系统,它不仅能够支持IBASE非结构化数据库的直接上网发布和全文检索, 而且对于传统关系型数据库也提供了导入和链接的支持.IBASE非结构化教据库系统对高校数字图书馆信息资源建提供了有效解决方案.  相似文献   

14.
陈芸  吴杰 《科技创业月刊》2008,21(5):139-140
XBRL是目前应用于非结构化信息处理,尤其是财务信息处理的最新技术。以XBRL编码的信息的可靠性和完整性存在着多方面的威胁,所以XBRL信息需要审计。XBRL的应用将为审计带来多方面的影响,探讨了XBRL对审计功能、审计程序和审计技术的具体影响,随着XBRL的深入应用,XBRL审计的重要性将愈受关注。  相似文献   

15.
如何在海量的非结构文档内容中准确、快捷找到自己所需要的信息,是信息检索技术的研究重点。全文检索是现代信息检索技术一个非常重要的分支,是解决非结构化数据检索需求的重要技术手段。以已发布的各类通信业务管理规范的全文检索需求为切入点,设计并实现了适用于国家级气象信息化业务管理的非结构化文档全文检索系统。该系统基于Java技术,并采用Lucene技术框架,对业务规范信息进行了分析和重新数据组织,确保良好的检索时效与准确率。系统应用后能快速应对业务变化,在已有的大量的规定、规范、标准和公文函件中迅速、准确、全面地查找有关资料信息,帮助用户准确把握气象信息化发展脉络。  相似文献   

16.
大数据这个词汇出现在当企业生产出了一系列的数据,包含业务关键信息,并且过于庞大以至于传统的关系数据库所无法正常处理。判定什么样数据保持非结构化状态,这取决于企业IT基础架构的规模程度,不过对于各种规模的企业而言通常都有一些信息量可以被认作是大数据。IT管理员和业务分析师的困难点不仅在于如何存储这些数据,而且还在于如何以合适地方式对其进行存储,便于分析,这最终可以导出关键业务模型和相应的深入分析。  相似文献   

17.
陆康 《现代情报》2019,39(10):102-109
[目的/意义]互联网社会的形成让高校处于数据圈之中。高校用户的数据搜索习惯存在着差异性。Web搜索仍然是用户信息查阅的基本方式。大数据的非结构化、数据量大以及数据挖掘与语言处理等问题的存在,用户对搜索结果的满意度不高。高校用户的"小数据"能够反映其显性需求,其数据分析与挖掘能够反映出用户的隐性需求。以用户为中心的服务体系是提高服务效率、提升用户满意度与忠诚度的最有效方法之一。[方法/过程]以文献分析为基础,分析高校图书馆业务数据的构成、收集意义、规范、方法与用途。探索高校图书馆业务数据收集方法,以及构建"数据圈"支持图书馆智慧服务开展的必要性。[结果/结论]高校图书馆"数据圈"的形成,是智慧图书馆伴随着互联网社会发展的必经之路,也是智慧服务得以有效实施的基础。"数据圈"形成的规范化、标准化也是智慧图书馆领域所要重视的问题。  相似文献   

18.
正为了应对大型企业对非结构化数据的合理管理和有效应用两个方面要求,设计了非结构化数据管理系统平台,分析该系统平台的设计架构、接口设计、功能设计和主要功能模块。该系统可用于对企业各类非结构化数据的有效全生命周期管理,并拥有更好的客户体验,能够最大限度的贴合企业内容管理的特点,支持大规模,集团型的知识管理需求。非结构化数据是企业重要的信息资产,如何安全的存储非结构化数据,并将之高效的利用,是企业经常面对的难  相似文献   

19.
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。  相似文献   

20.
施培公 《科研管理》1994,15(2):35-38
本文分析了企业技术创新管理的内容和特点,鉴于创新管理中包含大量综合性、非结构化和半结构化的软问题,尝试利用人工智能、专家系统技术对其进行支持.弥补人工经验决策、评估的缺陷,降低创新实施风险.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号