pythonライブラリのpandasである値(要素)を持っている行を抜き出す等のメモ

日頃からPythonでいろいろプログラムを書いている私です

久しぶりにcsvファイルをあつかう事案が発生したのでpandasというライブラリを使ってみることにしました

使っていて手こずったところをメモします

テストデータ

予めテストデータを作っておきます

ファイル名はtarget.csvとし、中身は適当に下記のようにしました

ID NAME NUM
A01 Tanaka 1
A02 Sato 2
A03 Yamada 3
A04 Kondo 3

csvファイルの読み込み

いろんなサイトで解説しているようにcsvファイルを読み込みます

ある列のデータ型を一括で変える

現在、target.csvのNUMには数値が入っています

これを一括で文字列(正確にはobject)へ変換をします

ある列同士を結合して新しい列に加える

すべての列を結合し、新たに”KETUGOU”という列を作ってみます

ただ結合するのはつまらないので間にハイフン(-)を入れます

また、NUMがint型なので結合前にほかの列と型を揃えておきます

特定の行にある列の値をもらいたい

たとえば、サンプルファイル(target.csv)にあるKondoのKETUGOUの値をもらいたいとしたいとします

上記の列同士を結合してからもらうようにしてみます

値は配列で受け取ることになります

そのため、values[0]にしてあげることでひとつだけもらうようにしています

ある列にて任意の値を持っているすべて列に対して、異なる列の値を変更する

あらたにSTATEという列を追加し、NUMの列で”3″という値を持っているすべての行のSTATE列に”OK”という値を入れたいとします

この操作がpandasではかなりギミックであり、悩んだところでした

肝なのが.atをつけて行うということと、[ ](括弧)のなかで条件文をつくることです

値を0埋め(ゼロ埋め)する

数値の値を揃えるときに0埋めで行うための処理です

サンプルでは整数にて10の位に合わせています

スポンサーリンク




スポンサーリンク

参考文献

スポンサーリンク







フォローする