python 使用sklearn计算TF-IDF权重

最新推荐文章于 2024-08-23 17:21:41 发布

缥缈之力

最新推荐文章于 2024-08-23 17:21:41 发布

阅读量3.3k

点赞数

分类专栏：机器学习 python 文章标签： python 文本分类 TF-IDF

python 同时被 2 个专栏收录

8 篇文章

订阅专栏

2 篇文章

订阅专栏

本文介绍了一种处理文件并从中提取关键词的方法。首先利用os.listdir()获取指定目录下的文件列表，然后采用jieba分词工具对文件内容进行分词处理，并选取topK高频词汇作为关键词。最后使用sklearn计算文本中各关键词的权重。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.通过os.listdir（）函数获取指定目录下的文件名list

2.对文件使用jieba进行分词并提取topK作为关键词

3.使用sklearn计算每一个文本中所有关键词的权重（文本中没有的词权重为0）

4.参考链接：

http://blog.csdn.net/zhzhl202/article/details/819710

http://www.it165.net/pro/html/201407/17648.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。