基于统计与规则的术语抽取 |
| |
引用本文: | 程斌,张水茂.基于统计与规则的术语抽取[J].科技广场,2009(9):26-28. |
| |
作者姓名: | 程斌 张水茂 |
| |
作者单位: | 江西经济管理干部学院,江西南昌330088 |
| |
摘 要: | 术语抽取是自然语言处理领域的一项基础性工作。本文提出了一种基于统计与规则相结合的术语抽取方法:首先在对主语料进行分词标注的基础上,通过基于词性规则的重复串查找得到候选术语,然后依据术语具有单元性和术语性的特点,先后采用SCP以及C-value模型对候选术语进行过滤得到术语。实验表明该方法切实有效,可以识别不同长度和不同领域的术语,能够应用于词典编纂和术语抽取等领域。
|
关 键 词: | 术语抽取 SCP模型 C-value模型 |
Term Extraction Base on Statistic Model and Rule |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
|