本文针对传统TF-IDF算法在文本分类中的不足,提出一种改进方法。通过引入词频与逆文档频率的优化计算方式,提升了特征权重的准确性。该方法有效解决了高维稀疏数据下的分类性能问题,实验结果表明改进后的算法在多个数据集上均取得了更好的分类效果。
文档为pdf格式,0.17MB,总共3页。
举报