国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python基础教程 > Python如何使用Spacy进行分词

Python如何使用Spacy进行分词

Python Spacy

头像

小妮浅浅

2021-07-29 09:42:355802浏览 · 0收藏 · 0评论

说明

1、Spacy语言模型包含一些强大的文本分析功能,如词性标记和命名实体识别。

2、导入spacy相关模块后,需要加载中文处理包。然后读小说数据,nlp处理天龙八部小说,包括分词、定量、词性标注、语法分析、命名实体识别,用符号/分隔小说。最后,通过is_stop函数判断单词中的单词是否为无效单词,删除无效单词后,将结果写入txt文件。

实例

import spacy
import pandas as pd
import time
from spacy.lang.zh.stop_words import STOP_WORDS
 
nlp = spacy.load('zh_core_web_sm')
 
def fenci_stopwords(data,newdata1):
    fenci = []
    qc_stopwords =[]
 
    article = pd.read_table(data,encoding="utf-8")
    start1 = time.time()
    with open(newdata1,'w',encoding='utf-8') as f1:
        for i in article["天龙八部"]:#分词
            doc = nlp(i)
            result1 = '/'.join([t.text for t in doc])
            fenci.append(result1)
 
  for j in fenci:#去除停用词   
            words = nlp.vocab[j]    
            if words.is_stop == False:        
                qc_stopwords.append(j)
                result2 = '/'.join(qc_stopwords)
                f1.write(result2)
    end1 = time.time()
    return end1-start1

以上就是Python使用Spacy进行分词的方法,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

人野兽马狗猪大全| 乳欲人妻办公室奶水| 撸撸社| 《一滴都不许漏》何泽城林荫| 男生把小困困放到女生困里视频| 学生和老师做爰BD| B级文件| 人口兽猪马狗第1集| 日韩电影| 日剧《轮流取珠》| 男生困困进女生困困洞视频| 全飞秒手术2024价目表| 星空无限MV国产剧苏畅| 女子监狱理伦A片| 《喂奶人妻厨房HD》| 电影《裸体肉欲》| 妻子的姐姐免费观看大全电视剧| 暴躁少女免费看完整版| 电动木马炮机BY笔趣阁全文免费..| 苍空电影在线观看完整| 小妈爱上继子免费观看电视剧| 电影免费观看高清完整版在线观看| 9.1萝卜黄| 《强壮的公2做爰观看| 法国伦理巜公共汽车| 兽父1到16集一口气看完| 无人区免费观看高清电视剧 | 男生将78申请女生的定眼| 《军妓肉体》在线观看| 《法国空乘9》| 打牌生猴子的视频大全 | 女生给男生吃小头头| 《日本公与媳5》公妇伦| 欧美版理伦片巜人间天堂| 羞答答在线观看免费高清电视剧| 搜索引擎| 《再来一次好吗》免费观看| 成人韩国三色眼影| 成品动漫网站入口网页版怎样 | 精产一二三产区划分标准图片| 《高压监狱3》法国版正版