R语言中文分词10分钟快速入门
来源: | 作者:k君 | 发布时间: 2017-03-21 | 100 次浏览 | 分享到:
n n1.中文分词R包简介n njiebaR是“结巴”中文分词的R语言版本,作者覃文锋,支持四种分词模式:最大概率法、HMM、混合模型和索引模型,同时有词性标注,关键词提取,文本Simhash相似度比较等功能,项目使用了Rcpp和CppJieba进行开发"