import pandas as pd
# 导入数据
df = pd.read_excel() #read_csv()
# 清洗缺失值
df.isnull.sum() # 统计空缺值个数
df.notnull.sum() ##统计非空缺值个数
df.dropna(axis=0,inplace=True) # axis后面的0表示按行操作,1表示按列操作;inplace表示修改原数据
# 替换缺失值
df.fillna('新值',inplace=True)
# 去除重复数据
df.drop_duplicates('列名',inplace=True) # 去除多列重复数据将‘列名’换成指定的多列subset=['A','B']
# 导入数据
df = pd.read_excel() #read_csv()
# 清洗缺失值
df.isnull.sum() # 统计空缺值个数
df.notnull.sum() ##统计非空缺值个数
df.dropna(axis=0,inplace=True) # axis后面的0表示按行操作,1表示按列操作;inplace表示修改原数据
# 替换缺失值
df.fillna('新值',inplace=True)
# 去除重复数据
df.drop_duplicates('列名',inplace=True) # 去除多列重复数据将‘列名’换成指定的多列subset=['A','B']