问题: pd.read_excel()读取excel数据后,用pd.isnull().sum()统计空值数量不对,代码如下
import pandas as pd df = pd.read_excel('test.xlsx',dtype=str) # 剔除空格 df = df.applymap(lambda x : str(x).strip()) print("b列为空的个数为"+ str(pd.isnull(df['b']).sum())) # 打印出来b列中为空的是0个
excel数据长这样,B2是一个空格,希望得到空值为2的结果
问题分析:
读取excel后的df是这样
使用applymap剔除空格后的df是这样
读取excel后的df的值(df.values)
使用applymap剔除空格后的df的值(df.values)
可以看到,在applymap方法处理后
值values的变化:一个空格变成了’’,之前的nan变成了’nan’(这里是字符串nan,当然不为空)
pd.isnull()只会统计NaN的数量,一个是字符串’‘,一个是字符串’nan’,因此都统计不到
解决: 将’'和’nan’全部替换为np.nan,isnull就可以统计到
import numpy as np import pandas as pd df = pd.read_excel('test.xlsx',dtype=str) # 剔除空格 df = df.applymap(lambda x : str(x).strip()) df[df == ''] = np.nan df[df == 'nan'] = np.nan print("b列为空的个数为"+ str(pd.isnull(df['b']).sum())) # 打印出来b列中为空的是2个
到此这篇关于pandas读取excel统计空值数量错误的解决方法的文章就介绍到这了,更多相关pandas读取excel空值内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
您可能感兴趣的文章:
- pandas读取excel时获取读取进度的实现
- pandas 读取excel文件的操作代码
- Python Pandas读取Excel日期数据的异常处理方法
- python pandas库读取excel/csv中指定行或列数据
- Python调用Pandas实现Excel读取
- 使用python的pandas读取excel文件中的数据详情
- Pandas读取Excel文件的六种方法
- pandas如何读取含有中文的excel
本文由 华域联盟 原创撰写:华域联盟 » pandas读取excel统计空值数量错误的解决方法
转载请保留出处和原文链接:https://www.cnhackhy.com/160418.htm