共查询到20条相似文献,搜索用时 936 毫秒
1.
文中提出了一种文本知识分析中的概念层次网络方法。该方法是一种文本概念分析的新思路。探讨了用面向对象技术与框架技术结合实现文本知识的抽象概念和具体概念的自动分析、知识组织、检索智能化方法。 相似文献
2.
3.
针对目前基于主题图的中文自动分类的空缺,文章在总结Ontopia对英文和挪威文自动分类的技术基础上,结合中文特殊性,构建了一个基于主题图的中文分类原型系统。该系统通过借助POI、PDF、SAX作为文档文本解析器提取文本,采用盘古分词对文本进行分析,以Java为系统实现主要语言,达到了基于主题图的中文自动分类的目的。 相似文献
4.
气象文本中存在大量的模糊性用语。不同的预报员在选词习惯上的不同对用户理解气象文本会带来差异。本文提出了一种基于Sugeno积分语言量词模型的气象文本自动生成技术,并讨论了在降水实况描述文本和降水预报文本的自动生成中如何实现。 相似文献
5.
6.
针对版面自动分析技术实现的实验与理论研究和基于图像子块轮廓的色彩与几何特性,能从较复杂的彩色图像和二值图像中分析出人们所感兴趣的子图像、文本及图形。 相似文献
7.
自动文本分类方法是文本分类中非常重要的一种分类方法,本文着重从模型与方法的角度进行探讨。首先给出了一个自动文本分类的形式化定义,然后提出了自动文本分类的流程模型。接着,对流程中的四个部分进行具体讨论。自动文本分类的应用非常广泛,为了叙述方便,以商务数据为例进行讨论,并且选择实例作为典型案例对自动文本分类后的可视化进行分析和具体研究。 相似文献
8.
一种基于词上下文向量的文本自动分类方法 总被引:1,自引:0,他引:1
分析了传统文本自动分类方法的不足、词上下文向量的含义及其在自动分类中的作用,提出了一种基于词上下文向量的文本自动分类方法,该方法利用词上下文向量来生成分类器的类别中心向量和待分类文本的文本向量,使分类质量有所提高。 相似文献
9.
目前的文本分类还是以人工分类为主,为了减少人工分类的不确定性和分类错误,将径向基函数(RBF)算法引入文本自动分类系统,实现文本的自动分类。实验结果表明,采用RBF构造的分类器在文本自动分类中具有较好的分类性能,其测试平均值(F1)比BP、kNN分类器的F1值都要高。 相似文献
10.
文本自动分类方法是指在给定的分类体系下,根据文本的内容自动判别类型的过程。它是当今信息搜索领域的重要研究方向。本文介绍了文本自动分类的重要作用及其关键技术。 相似文献
11.
《科技广场》2017,(5)
本文针对以Excel等文本格式存储的监考安排不便于教师实时查询及自动提醒等问题,设计实现了基于混合移动开发模式的监考自动提醒系统。该设计的基本思想是:将文本数据转存入数据库,然后利用Linux的自动处理事务功能定期读取数据库,实现对监考老师的当天监考自动提醒功能。系统采用JQuery+HTML5+Think PHP实现。首先编写脚本程序对文本数据进行逐行扫描和空值处理,统一数据结构;根据文本结构设计数据库,将数据转入数据库中,构建视图和存储过程实现有效数据的选取;然后配置Linux系统的Crontab任务定时扫描数据库,对当天有监考任务的教师通过阿里云SDK和SMTP协议分别实现短信和电子邮件提醒。系统设计可以较好的实现不同存储格式的文本数据在数据库的有效融合和统一,系统同时提供用户自定义监考信息的输入和查询,可用于学校的监考信息管理和定时信息提醒。 相似文献
12.
文本自动分类是文本信息处理中的一项基础性工作。将范例推理应用于文本分类中,并利用词语间的词共现信息从文本中抽取主题词和频繁词共现项目集,以及借助聚类算法对范例库进行索引,实现了基于范例推理的文本自动分类系统。实验表明,与基于TFIDF的文本表示方法和最近邻分类算法相比,基于词共现信息的文本表示方法和范例库的聚类索引能有效地改善分类的准确性和效率,从而拓宽了范例推理的应用领域。 相似文献
13.
在网络文本图像的自动提取过程中,计算机难以直接实现基于高层语义特征的文本图像提取,因此文本图像提取技术的性能很走程度上依赖于底层统计特征的提取。广义归一化图像信息度量(GNPIM)和Lorenz信息度量(LIM)在灰度级上描述了图像的分布,在语义层上反映了图像的内容,是区分文本图像和一般连续色调图像的有效统计特征,作为支持向量机(SVM)的输入向量。可区分文本图像与连续色调图像,从而实现网络中文本图像的自动提取。实验结果表明,基于GNPIM、LIM与SVM的文本图像提取技术能够有效提取网络中的文本图像。且正确率高,速度快。 相似文献
14.
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。 相似文献
15.
16.
《内蒙古科技与经济》2021,(18)
文章以豆瓣网站书籍评论为分析对象,采用中文情感词汇本体库进行情感要素的识别与加权,结合朴素贝叶斯算法实现了用户评论文本的情感自动分类,并探讨了该算法的分类效果,研究发现:朴素贝叶斯算法能够实现评论文本的情感分类,分类效果较好,但仍需结合规则匹配和人工校对的方式,提升分类效果。 相似文献
17.
覆盖算法在文本分类中的应用 总被引:4,自引:0,他引:4
本文利用前向神经网络的交叉覆盖算法,通过对文本进行分词的预处理后,实现文本的自动分类。应用该算法对语料库中的文本进行实验,从实验结果来看,该算法在运行时间和精度上都取得了令人满意的结果。 相似文献
18.
主要研究了文本分类精度问题。介绍了文本分类的基本过程,提出了一种改进的支持向量机文本分类技术,设计并实现了一个开放的中文文档自动分类系统。实验结果表明,提出的方法不仅具有较高的训练效率,同时也能得到很高的分类准确率和查全率。 相似文献
19.