pandas.query()で欠損値を指定する

スポンサーリンク
スポンサーリンク

.isnull()と.notnull()を使えば解決。engine=’python’を忘れずに

以下のようなDataFrameがあったとして、

import numpy as npimport pandas as pddf = pd.DataFrame([{'col_0': "A", 'col_1': 1, 'col_2': np.nan},                    {'col_0': "A", 'col_1': 4, 'col_2': 5},                    {'col_0': "B", 'col_1': 7, 'col_2': 8},                    {'col_0': "B", 'col_1': 9, 'col_2': 6}])df
dfの中身
df.query('col_2.isnull()', engine='python')
出力
df.query('col_2.notnull()', engine='python')
出力

エラーが出るときは大体後ろの
engine=”python”
を忘れてる。

.isna()や.notna()でもいける

タイトル通りだが、isnull()やnotnull()の代わりに.isna()や.notna()を使っても同じ結果を得られる。

df.query('col_2.isna()', engine='python')
出力
df.query('col_2.notna()', engine='python')
出力