第 31 卷第 11 期 计算机应用与软件 Vol. 31 No. 11
2014 年 11 月 Computer Applications and Software Nov. 2014
基于多特征的中文关键词抽取方法
杨 颖1 戴 彬2
1 川北医学院基础医学院 四川 南充 637100
2 西华师范大学商学院 四川 南充 637009
摘 要 关键词抽取是信息检索、文本分类、文本聚类以及自动文摘生成等技术的基础。在分析传统中文关键词抽取方法不足的
基础上,提出一种基于多特征的中文关键词提取方法。该方法在抽取中文关键词过程中,从词频、关联度、词性以及位置等多种特征
来全面考查关键词,有效地避免了传统关键词提取方法产生的偏差。实验结果表明,与传统方法相比,该方法在不同测试集上关键
词提取的平均召回率均得到明显提升。
关键词 关键词抽取 词频 关联度 文本聚类
中图分类号 TP391. 1 文献标识码 A DOI 10. 3969 /j. issn. 1000-386x. 2014. 11. 027
CHINESE KEYWORD EXTRACTION METHOD BASED ON MULTI-FEATURES
基于多特征的中文关键词抽取方法 来自beplayapp体育下载www.apt-nc.com转载请标明出处.