首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
在现在正蓬勃发展的信息检索和数据挖掘研究领域中,未登录词的识别具有十分重要的意义。基于互信息的地名识别方法,提出中文地名的上下文互信息概念,引入互信息对其进行定量的描述,达到了较好的中文地名识别效果。  相似文献   

2.
介绍一种基于词结合提取的未登录词识别方法.该方法对碎片分词后的文本建立二元模型,结合互信息和规则过滤提取由若干个词组合而成的未登录词(组).测试结果准确率为84.71%,召回率为72.13%.  相似文献   

3.
基于碎片分词的未登录词识别方法   总被引:1,自引:0,他引:1  
提出了一种新的基于碎片分词的未登录词识别方法。该方法首先对文本进行分词,然后对分词结果中的碎片进行全切分生成临时词典,并利用规则和频度信息给临时词典中的每个字串赋权值,最后利用贪心算法获得每个碎片的最长路径,从而提取碎片中的未登录词。实验证明该方法开放测试的准确率达到82.88%,召回率达到87.51%。  相似文献   

4.
中分词一直是大规模语料库加工的基础,它需要能够正确识别出语料中的已知词和未登录词,而各种基于规则和统计的方法在识别已知词和未登录词时各有优劣。本试分别从已知词和未登录词识别两个方面,对ACL—SIGHAN第一届国际中分词竞赛中各参赛系统进行比较,指出中分词既需要提高已知词识别的准确率,还要能够较好地预测语料中出现的未登录词,并处理好它们之间的平衡关系。  相似文献   

5.
由于汉语与英语有不同的特点,导致机器翻译时把汉语当做源语言要比把英语当做源语言要困难得多。本文试图从汉英机器翻译的角度探讨汉语自动分析的难点,包括词法分析、句法分析和汉英转换中的难点。  相似文献   

6.
由于汉语与英语有不同的特点,导致机器翻译时把汉语当做源语言要比把英语当做源语言要困难得多。本文试图从汉英机器翻译的角度探讨汉语自动分析的难点,包括词法分析、句法分析和汉英转换中的难点。  相似文献   

7.
随着信息量的不断增长,搜索引擎在网站中所起到的作用显得越来越重要,如何通过搜索引擎获得丰富的信息,成为用户关心的重要问题。通过设计实现基于字典的中文切词系统,并对不同格式的文件进行数据挖掘,改进北京市精品课程平台的搜索引擎。  相似文献   

8.
介绍了NOVELL网络远程启动后自登录的两种方法,一种是自动批处理文件法;另一种是两次登录法。  相似文献   

9.
Web数据挖掘是利用数据挖掘技术从Web站点的相关数据中提取有用的知识、有价值的模式和潜在规律的过程,能够为教师改进教学策略及网络教学资源建设提供决策建议,本文主要论述将Web数据挖应用于网络课程设计一些方法及Web使用挖掘在网络课程设计中常用的技术和算法.  相似文献   

10.
钟鏸 《西江大学学报》2005,26(2):46-47,61
基于互联网的应用系统,正面对着越来越多的“在线攻击”,严重地威胁着系统的信息安全.通过运用“附加码”的技术手段,可以有效抵挡来自黑客工具的在线攻击.  相似文献   

11.
互联网的广泛应用使Web数据挖掘成为当前数据挖掘研究的热点,而Web数据的结构却使对其所进行的数据控制十分复杂,XML的出现为Web数据挖掘技术提供了一个很好的入口。本文分析了XML文档的数据结构,提出一种经由HTML文档转换成XHTML并最终由XSL所决定的XML文档的Web数据挖掘模式。  相似文献   

12.
面向Web的数据挖掘是当今数据挖掘技术的热点。XML作为直接面向Web数据、基于Internet上的一种新的数据管理手段,为面向Web的数据挖掘带来了便利。分析了Web数据挖掘的特点和XML语言的优点,提出了运用XML解决Web数据挖掘中半结构化数据的模型抽取方法,最后对该方法进行了实例说明。  相似文献   

13.
该文首先剖析了数据挖掘技术,并阐述了XML在数据挖掘中的应用优势,然后构建了一个基于XML的面向多种Web教据的挖掘系统模型,最后详细介绍了模型中的三个层次构成,并介绍了其中关键技术的实现方法,以期为Web数据挖掘的研究提供参考.  相似文献   

14.
针对Web上数据的特点,指出了采用XML技术进行网络数据挖掘的优势.  相似文献   

15.
通过对我院校园网web服务器log记录进行数据挖掘,获取访问用户的特征和访问习惯,并与用户个人信息数据相结合,就能发现其中蕴含的知识,提取出用户的兴趣特征,从而开发有利于用户的界面,构建web智能化站点。  相似文献   

16.
高校英文网页较之其中文网页不仅内容滞后,而且翻译质量良莠不齐,存在问题颇多,通过调查国内12所高校的英文网页,发现其翻译问题突出体现于译者在翻译实践中忽视中西方语言与文化的差异,以及传播媒介的特殊性,致使文本的预期功能不能很好的实现,影响高校信息的传播与形象的提升;在收集语料的基础上着重从语言与文化的视角分析了英文网页中存在的翻译失误,并给出修改建议,以期提高翻译质量,并为同类文本的翻译提供借鉴作用。  相似文献   

17.
本文针对目前搜索引擎存在的不足,充分研究了个性化搜索引擎的发展现状,设计并实现了一种个性化搜索引擎,同时提出了一种查询语句优化策略,在此基础上,又对基于语义Web的搜索引擎进行了研究探索。  相似文献   

18.
介绍web挖掘的技术基础,阐述了Web挖掘的含义,从Web数据中发现潜在的有用信息和先前不知道的知识。描述了web挖掘的现状、分类以及web挖掘技术的流程,并对web挖掘的前景加以展望。  相似文献   

19.
翻译的"目的论"是以人类行为理论为指导,把翻译置于人类行为理论的范畴研究。翻译的行为所要表达的目的决定着整个翻译行为的过程。政府英文网站作为传播信息的一种重要手段,其翻译应以目的为核心,综合考虑翻译委托人、翻译者水平和翻译文章文本类型等因素的影响,采用灵活多样的翻译策略和方法实现译文在译语文化中的预期功能,从而达到交流和宣传的最终目的。  相似文献   

20.
因特网上有海量的数据信息,数据挖掘是从大量的数据中发现隐含的规律性内容,充分利用有用数据,废弃无用数据,解决数据的应用质量问题。通过对Web的数据挖掘和XML特点进行分析,讨论了使用XML实现基于Web的数据挖掘方法,提出了一种结合HTML、XMLJ、AVA的新型数据挖掘技术。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号