《pythondataframe中缺失值处理》由会员分享,可在线阅读,更多相关《pythondataframe中缺失值处理(1页珍藏版)》请在金锄头文库上搜索。
1、pythondataframe中缺失值处理、缺失值检测与统计1.按列df.isna().sum()df.isnull().sum()df.shape0-df.count()按行df.isna().sum(axis=1)df.isnull().sum(axis=1)df.shape1-df.count(axis=1)二、相关处理函数df.dropna(axis=0,how=any,thresh=None,subset=None,inplace=False)函数作用:删除含有空值的行或列axis:维度,axis=0表示index行,axis=1表示columns列,默认为0how:all表示这一行
2、或列中的元素全部缺失(为nan)才删除这一行或列,any表示这一行或列中只要有元素缺失,就删除这一行或列thresh:行或一列中至少出现了thresh个才删除。subset:在某些列的子集中选择出现了缺失值的列删除,不在子集中的含有缺失值得列或行不会删除(有axis决定是行还是列)inplace:得新数据是存为副本还是直接在原数据上进行修改。df.fillna(value=None,method=None,axis=None,inplace=False,limit=None,downcast=None)函数作用:填充缺失值value:需要用什么值去填充缺失值axis:确定填充维度,从行开始或是从列开始method:fill:用缺失值前面的一个值代替缺失值,如果axis=1,那么就是横向的前面的值替换后面的缺失值,如果axis=0,那么则是上面的值替换下面的缺失值backfill/bfill,缺失值后面的一个值代替前面的缺失值。注意这个参数不能与value同时出现limit:确定填充的个数,如果limit=2,则只填充两个缺失值。