Home

引用本文:

本文已被：浏览 593次下载 1198次
分享到：微信更多字体:加大+\|默认\|缩小-
基于STC的中文文本聚类算法
王国强[1];郑海清[2];牛军钰[2]^1,2
1.[1]上海市杨浦区业余大学,上海200092;2.[2]复旦大学计算机科学与工程系,上海200433

摘要:

提出了一种文档聚类方法，对用户的检索结果中类似的文档进行聚类，提供目录结构，辅助用户浏览检索结果．首先分析了现有的文本聚类方法，讨论了它们的优势和不足，然后提出了基于后缀树的中文文本聚类算法，并详细描述了该算法的原理和构造使用过程，及在算法实现的过程中遇到的关键问题及解决方案．

关键词: 后缀树文本聚类文本处理

DOI：

分类号:

基金项目:

Abstract:

Key words: