国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python基础教程 > Python如何使用Spacy进行分词

Python如何使用Spacy进行分词

Python Spacy

头像

小妮浅浅

2021-07-29 09:42:355802浏览 · 0收藏 · 0评论

说明

1、Spacy语言模型包含一些强大的文本分析功能,如词性标记和命名实体识别。

2、导入spacy相关模块后,需要加载中文处理包。然后读小说数据,nlp处理天龙八部小说,包括分词、定量、词性标注、语法分析、命名实体识别,用符号/分隔小说。最后,通过is_stop函数判断单词中的单词是否为无效单词,删除无效单词后,将结果写入txt文件。

实例

import spacy
import pandas as pd
import time
from spacy.lang.zh.stop_words import STOP_WORDS
 
nlp = spacy.load('zh_core_web_sm')
 
def fenci_stopwords(data,newdata1):
    fenci = []
    qc_stopwords =[]
 
    article = pd.read_table(data,encoding="utf-8")
    start1 = time.time()
    with open(newdata1,'w',encoding='utf-8') as f1:
        for i in article["天龙八部"]:#分词
            doc = nlp(i)
            result1 = '/'.join([t.text for t in doc])
            fenci.append(result1)
 
  for j in fenci:#去除停用词   
            words = nlp.vocab[j]    
            if words.is_stop == False:        
                qc_stopwords.append(j)
                result2 = '/'.join(qc_stopwords)
                f1.write(result2)
    end1 = time.time()
    return end1-start1

以上就是Python使用Spacy进行分词的方法,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

宝贝今天可不可以不带小雨伞| 夜店| 水蜜桃免费高清电视剧大全| 芒果浏览器| 妈妈叫我戴上避孕套是什么歌 | 《办公室高潮秘书2》电影| 精品人OR猪OR狗的DNA| 妈妈がだけの心に漂う| 小雪被老汉各种姿势玩弄视频| 《父承子波》金银花原文主角| 屁股翘起来跪在床上有好处吗 | 妈妈的职业4免费观看完整版高清| 一前一后三个人一起的游戏规则| 暴躁少女CSGO免费观看| 做的技巧视频教程大全| 按摩师把我添高潮了6次| 暴躁老阿姨与老年人的爱情与财运| XX| 免费观看已满十八岁的电视剧大全| 伦理《少妇的滋味》完整版| 《年轻朋友的妻子3》| 《玉尺经》| 《爸开车我抱着妈妈去姥姥家》| 女性扒开大腿内侧小肚子痒 | 啵啵影院| 优酷| 狗和女人戴避孕套会传染吗| 内衣视频| 一母四女共一婿的全诗解读| 色翁荡熄300篇| 彩浸福利| 表妹的下面好湿好紧| 琪琪在线影院电视剧免费 | 当着老公的面被维修工欺负 | 淑芬啊…啊别停灬用力啊视频| 高压监狱4伦理HD| 年轻的朋友电影在线观看免费完整| 女性一晚上3次纵欲导致不孕| 亚洲尺码与欧洲尺码区别专线| 哈尼克孜| 成人电影