自动标引中自然主题词的切分 |
| |
引用本文: | 靳从,唐振民,杨静宇.自动标引中自然主题词的切分[J].情报科学,2004,22(3):337-339. |
| |
作者姓名: | 靳从 唐振民 杨静宇 |
| |
作者单位: | 南京理工大学计算机系,南京,210094 |
| |
摘 要: | 自动标引是计算机文献管理中的一个重要过程。主题词的切分是自动标引的第一步,一般标引词均有标准主题词库,而自然主题词千差万别,使切分有一定的困难。本文利用自然主题词的特点,给出了一个基于自然主题词基本结构的切分方法,先使用相关信息对自然主题词的可能起始部分进行判断,再根据约束条件对自然主题词的整体进行判断,同时根据其出现的频率及位置施以加权处理,从而得到正确完整的自然主题词。通过标引系统的标引结果证明了方法可行。
|
关 键 词: | 自动标引 自然主题词 主题词切分 主题词库 计算机文献管理 |
文章编号: | 1007-7634(2004)03-0337-03 |
修稿时间: | 2003年5月6日 |
The Natural Keyword Segmentation in Automatic Indexing |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
|