期刊社
首页
编委会
期刊概况
投稿指导
优秀论文
联系我们
English
快速检索:
文章编号
中文标题
英文标题
作者英文名
作者中文名
单位中文名
单位英文名
中文关键词
英文关键词
中文摘要
英文摘要
基金项目
引用本文:
【打印本页】
【下载PDF全文】
【
查看/发表评论
】
【EndNote】
【RefMan】
【BibTex】
←前一篇
|
后一篇→
过刊浏览
高级检索
本文已被:浏览
592
次 下载
1198
次
分享到:
微信
更多
字体:
加大+
|
默认
|
缩小-
基于STC的中文文本聚类算法
王国强[1];郑海清[2];牛军钰[2]
1,2
1.[1]上海市杨浦区业余大学,上海200092;2.[2]复旦大学计算机科学与工程系,上海200433
摘要
:
提出了一种文档聚类方法,对用户的检索结果中类似的文档进行聚类,提供目录结构,辅助用户浏览检索结果.首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后提出了基于后缀树的中文文本聚类算法,并详细描述了该算法的原理和构造使用过程,及在算法实现的过程中遇到的关键问题及解决方案.
关键词
:
后缀树
文本聚类
文本处理
DOI:
分类号
:
基金项目:
Abstract
:
Key words
: