首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 936 毫秒
1.
温有奎 《情报科学》2002,20(3):259-261,292
文中提出了一种文本知识分析中的概念层次网络方法。该方法是一种文本概念分析的新思路。探讨了用面向对象技术与框架技术结合实现文本知识的抽象概念和具体概念的自动分析、知识组织、检索智能化方法。  相似文献   

2.
中文自动文摘在搜索引擎中的应用   总被引:2,自引:0,他引:2  
董建设  任丽  周燕玲 《情报科学》2006,24(2):267-269,309
将自动文摘应用与搜索引擎系统,可以使用户更方便、直观地了解被命中网页的内容。本系统在实现基于网页的自动文摘时,针对Web文本的特点,采用了以统计为基础,统计和规则相结合的自动文摘生成策略,实现了HTML标记加权处理、中文文本切分和同义词分析,在此基础上完成了基于统计的文摘句初步提取和基于语用规则的进一步处理。  相似文献   

3.
针对目前基于主题图的中文自动分类的空缺,文章在总结Ontopia对英文和挪威文自动分类的技术基础上,结合中文特殊性,构建了一个基于主题图的中文分类原型系统。该系统通过借助POI、PDF、SAX作为文档文本解析器提取文本,采用盘古分词对文本进行分析,以Java为系统实现主要语言,达到了基于主题图的中文自动分类的目的。  相似文献   

4.
气象文本中存在大量的模糊性用语。不同的预报员在选词习惯上的不同对用户理解气象文本会带来差异。本文提出了一种基于Sugeno积分语言量词模型的气象文本自动生成技术,并讨论了在降水实况描述文本和降水预报文本的自动生成中如何实现。  相似文献   

5.
基于中文信息抽取的概念,提出一套基于语义模板的地震应急文本信息地图自动标绘的技术方案。针对地震应急文本信息和汉语的特点,对应急文本信息进行分词、词性标注和语义分析等处理,按照预定义语义模板提取震情、灾情信息并形成结构化信息、并与空间关联,标绘形成地震应急态势图。方案实现了传统手工标绘向自动标绘的转换,提高了地震应急态势图标绘效率。  相似文献   

6.
针对版面自动分析技术实现的实验与理论研究和基于图像子块轮廓的色彩与几何特性,能从较复杂的彩色图像和二值图像中分析出人们所感兴趣的子图像、文本及图形。  相似文献   

7.
陈旭毅 《情报科学》2007,25(10):1530-1533
自动文本分类方法是文本分类中非常重要的一种分类方法,本文着重从模型与方法的角度进行探讨。首先给出了一个自动文本分类的形式化定义,然后提出了自动文本分类的流程模型。接着,对流程中的四个部分进行具体讨论。自动文本分类的应用非常广泛,为了叙述方便,以商务数据为例进行讨论,并且选择实例作为典型案例对自动文本分类后的可视化进行分析和具体研究。  相似文献   

8.
一种基于词上下文向量的文本自动分类方法   总被引:1,自引:0,他引:1  
分析了传统文本自动分类方法的不足、词上下文向量的含义及其在自动分类中的作用,提出了一种基于词上下文向量的文本自动分类方法,该方法利用词上下文向量来生成分类器的类别中心向量和待分类文本的文本向量,使分类质量有所提高。  相似文献   

9.
目前的文本分类还是以人工分类为主,为了减少人工分类的不确定性和分类错误,将径向基函数(RBF)算法引入文本自动分类系统,实现文本的自动分类。实验结果表明,采用RBF构造的分类器在文本自动分类中具有较好的分类性能,其测试平均值(F1)比BP、kNN分类器的F1值都要高。  相似文献   

10.
杨应全 《现代情报》2005,25(3):168-170
文本自动分类方法是指在给定的分类体系下,根据文本的内容自动判别类型的过程。它是当今信息搜索领域的重要研究方向。本文介绍了文本自动分类的重要作用及其关键技术。  相似文献   

11.
本文针对以Excel等文本格式存储的监考安排不便于教师实时查询及自动提醒等问题,设计实现了基于混合移动开发模式的监考自动提醒系统。该设计的基本思想是:将文本数据转存入数据库,然后利用Linux的自动处理事务功能定期读取数据库,实现对监考老师的当天监考自动提醒功能。系统采用JQuery+HTML5+Think PHP实现。首先编写脚本程序对文本数据进行逐行扫描和空值处理,统一数据结构;根据文本结构设计数据库,将数据转入数据库中,构建视图和存储过程实现有效数据的选取;然后配置Linux系统的Crontab任务定时扫描数据库,对当天有监考任务的教师通过阿里云SDK和SMTP协议分别实现短信和电子邮件提醒。系统设计可以较好的实现不同存储格式的文本数据在数据库的有效融合和统一,系统同时提供用户自定义监考信息的输入和查询,可用于学校的监考信息管理和定时信息提醒。  相似文献   

12.
文本自动分类是文本信息处理中的一项基础性工作。将范例推理应用于文本分类中,并利用词语间的词共现信息从文本中抽取主题词和频繁词共现项目集,以及借助聚类算法对范例库进行索引,实现了基于范例推理的文本自动分类系统。实验表明,与基于TFIDF的文本表示方法和最近邻分类算法相比,基于词共现信息的文本表示方法和范例库的聚类索引能有效地改善分类的准确性和效率,从而拓宽了范例推理的应用领域。  相似文献   

13.
程娟  平西建  童莉  杨洋 《情报杂志》2006,25(4):69-70,73
在网络文本图像的自动提取过程中,计算机难以直接实现基于高层语义特征的文本图像提取,因此文本图像提取技术的性能很走程度上依赖于底层统计特征的提取。广义归一化图像信息度量(GNPIM)和Lorenz信息度量(LIM)在灰度级上描述了图像的分布,在语义层上反映了图像的内容,是区分文本图像和一般连续色调图像的有效统计特征,作为支持向量机(SVM)的输入向量。可区分文本图像与连续色调图像,从而实现网络中文本图像的自动提取。实验结果表明,基于GNPIM、LIM与SVM的文本图像提取技术能够有效提取网络中的文本图像。且正确率高,速度快。  相似文献   

14.
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。  相似文献   

15.
为提高中文文本分类科研与教学人员的工作效率,本文针对国内现有中文文本分类系统的研发现状,构建一个包括预处理、特征选择、权值计算、自动分类和分类效果测评等文本分类全过程的管理平台。开发过程中,本文使用系统集成思想和方法将自编软件代码与相关的开源软件代码进行集成。经测试,该系统实现了文本自动分类过程的全部功能。  相似文献   

16.
文章以豆瓣网站书籍评论为分析对象,采用中文情感词汇本体库进行情感要素的识别与加权,结合朴素贝叶斯算法实现了用户评论文本的情感自动分类,并探讨了该算法的分类效果,研究发现:朴素贝叶斯算法能够实现评论文本的情感分类,分类效果较好,但仍需结合规则匹配和人工校对的方式,提升分类效果。  相似文献   

17.
覆盖算法在文本分类中的应用   总被引:4,自引:0,他引:4  
本文利用前向神经网络的交叉覆盖算法,通过对文本进行分词的预处理后,实现文本的自动分类。应用该算法对语料库中的文本进行实验,从实验结果来看,该算法在运行时间和精度上都取得了令人满意的结果。  相似文献   

18.
高晓琴 《科技通报》2012,28(4):70-71
主要研究了文本分类精度问题。介绍了文本分类的基本过程,提出了一种改进的支持向量机文本分类技术,设计并实现了一个开放的中文文档自动分类系统。实验结果表明,提出的方法不仅具有较高的训练效率,同时也能得到很高的分类准确率和查全率。  相似文献   

19.
汉语自动分词与中华民族文化复兴紧密相联 ,但汉语自动分词又是目前中文信息处理中的难题。通过分析现有汉语词自动分词方法及其局限性、汉语词自动分词中存在的困难、汉语同西方语言和日语的差别 ,认为传统汉语文本具有不可自动切分性 ,从汉语自动分词的成本、影响和汉语言发展的前途出发 ,必须对传统汉语文本进行改革。提出了一种新的自动分词思维 :“无词典切分” ,即改变汉语书写习惯 ,在汉语文本生成时在汉语词之间增加分隔信息 ,使汉语适于计算机自动处理。  相似文献   

20.
基于SVM的多类文本分类研究   总被引:9,自引:0,他引:9  
基于统计学习理论.构建了SVM文本分类模型,并给出了模型参数的100自动选择算法,解决了以往参数靠经验确定的弊端。传统的文本分类系统不能处理一篇文档同属多类别的情形,论文将该情形归结为多类文本分类问题,提出二叉决策树SVM模型,并就农业机械化工程文档进行了实证分析。结果表明,该算法具有较好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号