国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python基础教程 > Python中Tf-idf文本特征的提取

Python中Tf-idf文本特征的提取

Python Tf-idf

头像

小妮浅浅

2021-09-15 09:25:473836浏览 · 0收藏 · 0评论

说明

1、TF-IDF是如果词或词组出现在文章中的概率较高,而在其他文章中很少出现,那么它就被认为具有很好的类别区分能力,适合进行分类。

2、提取文本特征,用来评估字词对文件集或某个语料库中文件的重要性。

实例

def tfidf_demo():
    """
    用tfidf的方法进行文本特征提取
    :return:
    """
    # 1.将中文文本进行分词
    data = ["一种还是一种今天很残酷,明天更残酷,后天很美好,但绝对大部分是死在明天晚上,所以每个人不要放弃今天。",
            "我们看到的从很远星系来的光是在几百万年之前发出的,这样当我们看到宇宙时,我们是在看它的过去。",
            "如果只用一种方式了解某样事物,你就不会真正了解它。了解事物真正含义的秘密取决于如何将其与我们所了解的事物相联系。"]
    data_new = []
    for sent in data:
        data_new.append(cut_word(sent))
    # print(data_new)
    # 2.实例化一个转换器类
    transfer = TfidfVectorizer(stop_words=["一种", '因为'])
    # 3.调用fit_transform
    data_final = transfer.fit_transform(data_new)
    print("data_new:\n", data_final.toarray())
    print("特征名字:\n", transfer.get_feature_names())
    return None

以上就是Python中Tf-idf文本特征的提取,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

扌桑达鬲的日| 双人床上剧烈运动会怎么消除 | 欧美XBOX与IPHONE| 美国禁忌6 结局| 《特别酒店》免费观看| 小叔子从后面抱住我的电视剧 | 初尝少妇王老师的第一次在线观看| 二人努力生猴子免费观看| 添女人荫蒂全部过程AV视频| 新加坡疫情| 《公与媳夫妇:交换》| 桃色章小蕙| 《暴力强伦轩》| 爸爸缓慢有力送女儿的文案| 《晚上准备好纸巾》| 耕耘小侄女小说全文免费阅读 | 爸爸经常出差妈妈给我生孩子| 《熟妇的荡欲》免费看| X7X7X7任意噪1060| 男人添女人荫道口视频| 春闺艳妇(古言)作者:年富一年| 刘老汉的儿媳小雪的背景资料| 姐姐呀姐姐快停下是什么歌曲 | 初中小姐姐脚丫踩在男生困困| 《医务室的小秘密》动漫第一季免... | 星空无限传媒免费观看电视剧| 十八岁完整版高清免费观看| 没戴奶罩他含了一天| 爸爸VICIUSSS幼儿小女孩| YOUJIZZ| 《后宫狂热》动浸全集完整| 苏软软汆肉的日常花卷 | 小叔子从后面抱住我的电视剧| 老旺的大肉蟒进进出出| 《后宫狂热》动漫全集完整| 美国禁忌2在线观看电视剧| 《为子献身》高清完整版在线观看| 中字《喝醉的丈夫被结城送回家》| 谷原希美| 啵啵| 老汉猛躁女人XXXXX88AV