使用python的pandas库进行数据清洗

只看楼主
收藏
回复

贴吧用户_G93yW8M
四方游侠
5

import pandas as pd
# 导入数据
df = pd.read_excel() #read_csv()
# 清洗缺失值
df.isnull.sum() # 统计空缺值个数
df.notnull.sum() ##统计非空缺值个数
df.dropna(axis=0,inplace=True) # axis后面的0表示按行操作，1表示按列操作;inplace表示修改原数据
# 替换缺失值
df.fillna('新值',inplace=True)
# 去除重复数据
df.drop_duplicates('列名',inplace=True) # 去除多列重复数据将‘列名’换成指定的多列subset=['A','B']

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示

0回复贴，共1页

<<返回数据分析吧

分享到:

日	一	二	三	四	五	六