共查询到20条相似文献,搜索用时 15 毫秒
2.
3.
当前建设工程合同管理工作量大,长期依赖人工审核和主观经验,为改变合同审查依赖主观经验的现状,进一步探索和实现合同条款智能识别和智能审核,尝试引入基于深度学习(DL)的自然语言处理(NLP)技术,提出一种建设工程合同智能分类方法。首先,设计合同智能分类方案,分别采用卷积神经网络(CNN)、长短期记忆网络(LSTM)和融合模型进行计算实验;其次,将CNN和LSTM模型用于合同文本特征提取和合同文本分类中,通过融合两个神经网络以提升分类模型的性能指标。结果显示,精确率和召回率的调和平均数(F1值)最高的为融合模型,其次是LSTM模型,CNN模型最低。相较于基于机器学习的其他同类研究,基于NLP和DL的建设工程合同分类融合模型能够提高合同文本分类任务的效果,实现对大规模数据量的施工、勘察、监理等不同类型合同的准确识别以及快速分类和归档。 相似文献
4.
5.
基于量子自组织网络的Web文本自动分类方法 总被引:3,自引:0,他引:3
针对Web信息挖掘中的文本自动分类问题,提出了一种基于模糊特征向量和量子自组织特征映射网络的分类方法.该方法在特征提取时充分考虑了特征项在文档中的Web位置信息,构造出模糊特征向量,使自动分类原则更接近手工分类方法. 相似文献
6.
7.
8.
9.
10.
11.
12.
本文结合运用信息管理和人工智能的原理与技术,探讨了文本知识的自动分类方法,包括:自动归类与聚类方法、基于实例的学习分类方法和基于特征值的元学习方法。 相似文献
13.
提出一种基于云理论和神经网络构造决策树的文本分类方法。运用云神经网络学习变量间的云映射关系,从中生成云决策树。这种方法结合了神经网络的学习算法和决策树的推理方法,具有神经网络的学习能力,并且应用了云发生器对处理不确定性的能力。更符合人类的思维方式,从而进一步提高了文本分类的效率、准确性和可靠性。 相似文献
14.
[研究目的]随着国内智库的不断发展和建设,智库成果越来越多,涉及领域也纷繁复杂。为了方便决策者对所关注问题的查找,以及对问题类型的判断,需要对智库研究成果资源进行有效的数字化管理,本研究旨在研究如何对智库文本成果资源进行有效分类,从而实现智库成果高效系统的数据化管理。[研究方法]针对智库文本成果多为长文本的特点,利用基于Self-Attention的层次结构文本分类模型SHTC(Hierarchical structure model based on self-attention)依次从词、句两个层面对文本语义进行学习,并使用多尺寸卷积层提取关键特征信息获得最终的文档表示,再通过Softmax层进行分类。[研究结论]结果表明,基于Self-Attention的层次结构模型SHTC在智库文本分类任务中准确率达到82.43%,在智库文本分类任务上具有更优的分类效果。 相似文献
15.
基于模糊向量空间的文本分类方法 总被引:1,自引:0,他引:1
本文针对文本自动分类问题,提出了一种基于模糊向量空间模型和径向基函数网络的分类方法。网络由输入层、隐层和输出层组成。输入层完成分类样本的输入,隐层提取输入样本所隐含的模式特征,将分类结果在输出层表现出来。该方法在特征提取时充分考虑了特征项在文档中的位置信息,构造出模糊特征向量,使自动分类更接近手工分类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。 相似文献
16.
17.
自动文本分类的可视化方法探讨 总被引:1,自引:0,他引:1
自动文本分类方法是文本分类中非常重要的一种分类方法,本文着重从模型与方法的角度进行探讨。首先给出了一个自动文本分类的形式化定义,然后提出了自动文本分类的流程模型。接着,对流程中的四个部分进行具体讨论。自动文本分类的应用非常广泛,为了叙述方便,以商务数据为例进行讨论,并且选择实例作为典型案例对自动文本分类后的可视化进行分析和具体研究。 相似文献
18.
近年尽管针对中文本文分类的研究成果不少,但基于深度学习对中文政策等长文本进行自动分类的研究还不多见。为此,借鉴和拓展传统的数据增强方法,提出集成新时代人民日报分词语料库(NEPD)、简单数据增强(EDA)算法、word2vec和文本卷积神经网络(TextCNN)的NEWT新型计算框架;实证部分,基于中国地方政府发布的科技政策文本进行算法校验。实验结果显示,在取词长度分别为500、750和1 000词的情况下,应用NEWT算法对中文科技政策文本进行分类的效果优于RCNN、Bi-LSTM和CapsNet等传统深度学习模型,F1值的平均提升比例超过13%;同时,NEWT在较短取词长度下能够实现全文输入的近似效果,可以部分改善传统深度学习模型在中文长文本自动分类任务中的计算效率。 相似文献
19.
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高. 相似文献