国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python基础教程 > python数据预处理的三种情况

python数据预处理的三种情况

python预处理

头像

小妮浅浅

2021-06-10 16:21:313494浏览 · 0收藏 · 0评论

1、缺失数据的处理

导入的数据存在缺失是经常发生的,最简单的处理方式是删除缺失的数据行。使用 pandas 中的 .dropna() 删除含有缺失值的行或列,也可以 对特定的列进行缺失值删除处理 。

dfNew = dfData.dropna(axis = 0))  # 删除含有缺失值的行

有时也会填充缺失值或替换缺失值,在此就不做介绍了。

2、重复数据的处理

对于重复数据,通常会删除重复行。使用 pandas 中的 .duplicated() 可以查询重复数据的内容,使用 .drop_duplicated() 可以删除重复数据,也可以对指定的数据列进行去重。

 dfNew = dfData.drop_duplicates(inplace=True)  # 删除重复的数据行

3、异常值处理

数据中可能包括异常值, 是指一个样本中的数值明显偏离样本集中其它样本的观测值,也称为离群点。异常值可以通过箱线图、正态分布图进行识别,也可以通过回归、聚类建模进行识别。

箱线图技术是利用数据的分位数识别其中的异常点。箱形图分析也超过本文的内容,不能详细介绍了。只能笼统地说通过观察箱形图,可以查看整体的异常情况,进而发现异常值。

    dfData.boxplot()  # 绘制箱形图

以上就是python数据预处理的三种情况,希望对大家有所帮助。更多Python学习指路:python基础教程

推荐操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

法国时装秀| 桃色| 男生把小困困放到女生困里视频| 情满四合院| 主人~我错了请把它关掉歌词| 妈妈がだけの心に漂う| 激战2奶妈| 美国式禁忌5老熟女| 芬太尼问题百度百科| 《无法满足》意大利| 做完放里面睡觉醒了继续| 护士二姐妹精神诊所| 7777影院免费观看电视剧大全| 《性房纵欲》在线观看| 涂了春药的奶头被众人抡H漫画| 蜜桃成熟时在线观看| 《不忠》免费观看完整版电影 | 多村野史| 黑瓜网-每日大赛 抖音风合集| 爸爸你真棒插曲快来救救我小说 | BOBO浏览器| 《朋友的妈妈2》中字头歌词| 宝贝今天可不可以不带小雨伞小说| 男按摩师舌头伸进去了SPA漫画| 快拨出天我是你母亲歌词监控| 少女配狗视频大全播放| 涂了春药的奶头被众人抡H漫画| 《医务室上垒》动漫全集在线观看| 美女溜溜身子视频素材高清| 两个男生做酿酿酱酱酱视频| 火车上荫蒂添的好舒服图片| 妈妈がだけの心に漂う| 《疯狂72小时》韩剧| 成品人和精品人的特点分析| 成品人和精品人的区别哪个好| 美国式禁忌5老熟女| 姐姐的闺蜜2字ID高冷霸气| 男牛把小困困进女生困里电视剧 | AAAAA级产妇孕妇| 麻豆 无码 国产在线观看| 公天天吃我奶躁我高H漫画