2017-11-14

pandasでいらない値を削除するためのチートシート

やりたいこと

  • Webスクレイピングしてきた後に、データをクリーニングする
  • その際、特定の文字列を含んだ行を削除したい

Pandasでいらない行を削除する方法

(1) ある列に特定の値を含んでいるものを削除(titleでルンバという値を含んだものを削除する)


df = df[df.title.str.contains("ルンバ") == False]

(2)ある列に特定の値を含んでいないものを削除(titleでルンバという値を含んでいないものを削除する)

df = df[df["title"].str.contains("ルンバ")==True]


注目の投稿

めちゃくちゃ久しぶりにこのブログ書いたw 更新3年ぶりw > 多様性というゲームは尊厳と自由を勝ち取るゲームなのかもしれないな。  もともとツイッターでツイートした内容なんだけど、ちょっと深ぼる。 ----- 自分は男 x 30代x 二児の父 x 経営者 x 都心(共働き世...