首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的/意义]摘要作为学术论文中能够简明扼要地说明研究目的、研究方法和最终结论的陈述部分,具有较高的探究价值和意义。[方法/过程]选取长短期记忆网络(Long Short-Term Memory)、支持向量机(Support Vector Machine)、LSTM-CRF和CNN-CRF 4种模型,对3 672篇情报学领域的期刊论文进行摘要划分识别研究。[结果/结论]长短期记忆网络模型识别F值最高为69.15%,LSTM-CRF神经网络模型最高F值为88.76%,RNN-CRF模型最高F值达到89.10%,支持向量机分类器分类宏观F值最高为72.04%。该实验结果对图书情报领域的学术论文结构功能划分实验模型选取有较高的参考价值。  相似文献   

2.
基于HMM的楚辞自动分词标注研究   总被引:1,自引:0,他引:1  
研究古代和现代汉语的自动分词标注技术,用隐马尔科夫模型对《楚辞》进行自动分词标注实验,通过比较分词后的标注词性概率,取最大概率作为最后的分词和词性标注结果,并在其中使用全切分和加值平滑算法。经过实验调整分词标注程序模块和参数,最终得到一个分词标注辅助软件,其开放测试的分词F值为85%,标注F值为55%,高出基准F值14个百分点。  相似文献   

3.
文本情感分析是近年自然语言处理领域的研究热点之一,其中微博情感分析受到了学术界和企业界的广泛关注。微博情感分析是指对用户针对某一事件发表的言论进行正向、负向和中性情感的判定。本文在分析了标准RAE 模型缺点的基础上,提出了一种基于RAE+Dropout 的联合模型。该模型利用Dropout 技术有效地预防过拟合问题的发生,同时也提高了模型训练速度。RAE+Dropout 模型与RAE+ 词性选择模型、标准RAE 模型以及SVM 模型的对比实验结果表明:RAE+Dropout 模型的准确率和F1 值属于最优,比标准RAE 模型的准确值和F1 值高出0.82% 和0.64%,尤其是在高维词语向量中RAE+Dropout 模型的效果更加明显。  相似文献   

4.
基于支持向量机的产品属性识别研究   总被引:1,自引:0,他引:1  
本文提出了一种结合自然语言处理技术与支持向量机模型,从客户评论中识别产品属性的方法.为了检验该方法的有效性,从收集的22 157条有关餐厅的评论语句中随机选取3701条,对其进行手工标注.针对手工标注语料库,利用支持向量机方法进行了产品属性识别训练和测试,并在准确率、召回率、F1值方面进行了评估.在测试结果中,平均准确率为95.6%,平均召回率为81.9%,平均F1值为87.3%.实验结果表明,该方法在平均准确率、平均召回率和平均F1值方面均高于最大熵模型方法,在句子层次上具有较好的属性识别效果.  相似文献   

5.
[目的/意义]基于内容的过滤推荐中,针对向量空间模型表示文本时容易造成维度灾难的问题,提出利用余弦值r与匹配度值Sim相结合的方法对原有模型进行改进。[方法/过程]由文献资源和用户兴趣分别筛选出权重较大特征词的词向量,进而由公式计算余弦值r,结合对应的特征词权重进一步计算出匹配度值Sim,将其作为向目标用户推荐文献的依据,并利用河北工业大学图书馆的相关数据对改进模型、向量空间模型及LDA主题模型进行实验,最后利用查准率、召回率、F1值及运行时间等评价指标对3种模型的实验结果进行分析。[结果/结论]实验结果表明所提出的改进模型相比较于实验中的向量空间模型与LDA主题模型具有更高的应用价值与运行效率。  相似文献   

6.
谢维其 《大观周刊》2012,(13):78-78
本文研究的是江西省经济增长模型,通过对江西省1995年以来经济数据分析,以了解江西省经济发展的特点,并分析其与进出口、固定资产投资、和全社会总消费支出的关系,讨论这三个因素对经济总量的影响。运用Eviews软件和OLS分析法对1995—2009的历史数据进行分析,通过逐步剔除不合适的解释变量和对方程进行检验,最终找出江西省经济增长与主要影响要素之间的关系。  相似文献   

7.
古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SikuBERT模型,以“中国哲学书电子化计划”古籍数据库中的先秦两汉典籍为数据源,进行自动标点训练,探索基于深度学习技术的古文自动标点模型。实验结果表明:SikuBERT模型对先秦两汉典籍自动标点的整体效果比较优越,对书名号、冒号、句号以及逗号,预测表现良好,尤其是书名号与冒号标签的识别准确率、召回率与F1值均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性。  相似文献   

8.
本文以出版发行上市公司为研究对象,将高管薪酬与净利润比值作为检验指标,通过与文化产业内上市公司以及产业外净利润相似的其他国有上市公司进行对比,说明出版发行上市公司高管薪酬的激励强度,结果发现,无论是与产业内还是与产业外比较,出版发行上市公司高管薪酬利润比水平都明显偏低.  相似文献   

9.
基于IIG和LSI组合特征提取方法的文本聚类研究   总被引:8,自引:0,他引:8  
本文利用改进的信息增益特征选择方法和潜在语义索引技术组合的特征提取方法 ,对文本进行了有效的自动聚类。从语料库中抽取了 2 5 0篇文本 ,首先利用向量空间模型和改进的信息增益特征选择方法 ,构造文本特征向量 ,利用C 均值方法聚类 ,聚类结果准确率、查全率、F measure分别达到 0 .82、0 . 88、0 .83。在此基础上 ,对最优的特征选择结果运用潜在语义索引方法 ,对奇异值分解的结果进行截断处理 ,发现奇异值K取 4 0时聚类结果的准确率、查全率、F measure达到 0 . 95、0. 5 7、0 . 78,在有效地降维的同时 ,大幅度地提高了聚类的准确率。  相似文献   

10.
本文采用DEA模型对我国2008—2012年9个出版业上市公司的投入产出效率进行了测度研究。研究表明,我国出版业上市公司投入产出效率整体较高,且纯技术效率要略高于规模效益。最后,提出了改善出版业效率的政策建议。研究结果可以为出版业发展提供借鉴与参考。  相似文献   

11.
[目的/意义]"竞争力影响因素"作为竞争情报研究中的核心情报问题,成为众多学者的关注点。针对现有上市公司竞争力研究中分析对象多以年报中财务信息为主,忽略非财务信息的现象,尝试对年报披露的全部内容进行探索性分析,以期为竞争情报研究和实践提供理论指导。[方法/过程]以上市公司为例,运用扎根理论对36个样本的上市公司年报进行深度分析,通过开放式编码、主轴编码和选择性编码等过程提炼出与上市公司竞争力有关的概念和范畴。[结果/结论]建立以生产活动、外部环境、技术创新、要素管理、公司治理和核心竞争力认知为核心的上市公司竞争力影响因素PETEGP模型,各个因素与竞争力存在着时间效应,外部环境、技术创新、要素管理、公司治理和核心竞争力认知通过与生产活动的相互作用,共同影响上市公司竞争力。  相似文献   

12.
以江西省民办与公办高校图书馆员为调研对象,分别从基本资料情况、工作薪酬、职业维度等多个角度考察其工作满意度差异,并以"职业满意度"为因变量,以"基本资料情况"、"由工作报酬引起的心理变量"为自变量,尝试建立起标准化回归模型。目的在于达到整体提升江西省高校图书馆的服务水平,为江西省高校图书馆人力资源管理决策提供重要的依据。  相似文献   

13.
从《中国植物志》中随机采集1 000个文档作为数据集,采用自主学习规则与先导词相结合的算法实现中文物种描述文本的语义标注。实验数据表明,本研究设计的基于规则的算法整体标注效率(F值)达到0.930,大部分元素的F值在0.724-0.964之间,该算法优于朴素贝叶斯分类算法。同时证明,先导词对优化算法具有积极意义。  相似文献   

14.
基于BERT嵌入BiLSTM-CRF模型的中文专业术语抽取研究   总被引:2,自引:0,他引:2  
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。  相似文献   

15.
本文介绍了基于DSP(TMS320F28335)的开关电源检测系统,系统能够检测开关电源PCB板上的电容值、电感值、电阻值、输出电压值、二极管压降和电流型脉宽调制芯片的占空比,从而实现了对开关电源实时检测,对开关电源的故障分析具有重要意义。  相似文献   

16.
文本情感分析作为自然语言处理领域的一个重要分支,被广泛运用于舆情分析和内容推荐等领域,近年来成为研究的热点。提出基于语法规则和自注意力机制的GCN情感分析方法。首先,使用Glo Ve预训练模型与Bi LSTM模型提取文本的语义特征,并采用spa Cy工具对文本进行句法依存分析,从而提取文本的语法规则。其次,引入自注意力机制,并依据语义特征与语法规则构建GCN模型。最后,采用全连接层和Softmax分类器进行情感分类。实验结果表明,该方法与相关基线模型相比,在Twitter数据集上的准确率和宏F1值分别得到了提升,具有较好的情感分类性能。  相似文献   

17.
文本自动分词是非物质文化遗产相关数字人文研究的基础与关键步骤,是深度发掘非遗内在信息的前提。文章构建了国家级非物质文化遗产项目申报文本自动分词模型,探究了融入领域知识的机器学习模型CRF、深度学习模型Bi-LSTM-CRF和预训练语言模型BERT、RoBERTa、ALBERT在非遗文本上的分词性能,并对比了通用分词工具HanLP、Jieba、NLPIR的效果。在全部14种模型中,RoBERTa模型效果最佳,F值达到了97.28%,预训练模型中ALBERT在同等条件下训练速度最快。调用分词模型,构建了非遗文本领域词表和全文分词语料库,对非遗文本词汇分布情况进行了分析挖掘。开发了中国非物质文化遗产文本自动分词系统(CITS),为非遗文本自动分词及分词结果的多维可视化分析提供了工具。  相似文献   

18.
卢絮  刘平平  魏晨 《情报工程》2017,3(1):099-107
本文分析了沪深A 股上市公司年报上披露的财务数据与其年平均市值的关系,发现所有者权益、未分配利润和应交税费等财务数据与市值的相关性最高。同时,本文用这些财务数据构建了一个上市公司价值评估的多元回归模型,拟合效果很好。  相似文献   

19.
股票投资作为一种常见的投资方式,其投资方法也日新月异。越来越多的投资分析师利用计算机分析数据的优势来进行股票交易。支持向量机(Support Vector Machine,SVM)作为一种数据挖掘技术,在高维、非线性、过拟合等问题上具有较强处理能力,在股价预测方面表现出特有优势。系统论述了支持向量机的发展及其在预测领域中的应用,并构建SVM股票预测模型,运用股票数据对股票进行涨跌情况预测,通过选取核函数以及调整参数,并计算准确率、精确度、召回率、F1值等预测模型评估指标,分别进行SVM模型和SVM_RBF模型构建及模型效果评估。  相似文献   

20.
TF-IDF是一种常用的文本特征选择方法。基于该模型的特征选择思想,以特征项的类内分布、类间分布信息为依据,通过引入类内分布及类间分布权重因子对模型的TF及IDF部分进行加权,提出一种基于类别分布信息的文本特征选择模型。新模型使得TF部分含有类内文本频数信息,同时IDF部分含有特征项的类间频数信息。随后的文本分类试验表明,平均查全率、查准率分别提高6.4%、7.8%,F1值提高约7%,验证了本研究提出的基于类别分布的文本特征选择模型的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号