国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python基础教程 > Python中Tf-idf文本特征的提取

Python中Tf-idf文本特征的提取

Python Tf-idf

头像

小妮浅浅

2021-09-15 09:25:473836浏览 · 0收藏 · 0评论

说明

1、TF-IDF是如果词或词组出现在文章中的概率较高,而在其他文章中很少出现,那么它就被认为具有很好的类别区分能力,适合进行分类。

2、提取文本特征,用来评估字词对文件集或某个语料库中文件的重要性。

实例

def tfidf_demo():
    """
    用tfidf的方法进行文本特征提取
    :return:
    """
    # 1.将中文文本进行分词
    data = ["一种还是一种今天很残酷,明天更残酷,后天很美好,但绝对大部分是死在明天晚上,所以每个人不要放弃今天。",
            "我们看到的从很远星系来的光是在几百万年之前发出的,这样当我们看到宇宙时,我们是在看它的过去。",
            "如果只用一种方式了解某样事物,你就不会真正了解它。了解事物真正含义的秘密取决于如何将其与我们所了解的事物相联系。"]
    data_new = []
    for sent in data:
        data_new.append(cut_word(sent))
    # print(data_new)
    # 2.实例化一个转换器类
    transfer = TfidfVectorizer(stop_words=["一种", '因为'])
    # 3.调用fit_transform
    data_final = transfer.fit_transform(data_new)
    print("data_new:\n", data_final.toarray())
    print("特征名字:\n", transfer.get_feature_names())
    return None

以上就是Python中Tf-idf文本特征的提取,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

欧美大片| 欧美成人精品三区综合A片| 妻子的姐姐免费观看大全电视剧| 成品网站免费直播有哪些平台推荐| 7777影院免费观看电视剧大全| 久久无码亚洲成A人片| 《父承子波》金银花原文主角| 欧美人动物PPT免费模板大全| 两富婆轮流上阵| 家公给我治疗5中字| 可切换老司机模式浏览器 | 非洲女人免费观看大全电视剧 | 《请好好疼爱里面》免费观看| 《炸裂吧!巨棒》免费阅读漫画| 疯狂二人房间荷尔蒙爆发原声| 含紧一点H.边做边走| 免费观看已满十八岁的电视剧大全| 爸爸的大DJ小说| 国产X9X9X9X9X9X任意..| Y31成色好的S31正品| 《特殊游泳教练》| 征服公务员韵母王强最新章节列表| 1尿到0的直肠里| 妈妈的职业4免费观看完整版高清| 韩剧| 《法国空乘5》观看| 赵局长含着小婷的双乳| 100种双人插画姿势素材| 《出租屋1》| 两人一起做AJ的视频教程 | 《老板娘2》完整版| 老赵抱着陈婷在厨房做饭视频| 女人大阴屑夹缝是明虚还是阳虚| 老公让我把B扒开他日| xxxX| 小俊在雪姨身上耕耘小说免费阅读 | 苍井空高清图片| 免费的黄冈网站有哪些平台| 《女教师的味道3》在线观看| 《高压监狱》免费完整版满天星| 一枪战三母2雪姨是哪个角