目次
事前準備
「Pandas」というデータ解析を実施できるライブラリをインポートします
import pandas as pd
サンプル:学校データ
student_data.head()
infoとは?
info()メソッドを使うことで、データの要約情報を取得することができます
取得できる情報は下記3項目です
- Column:カラム名
- Non-Null Count:データがある行数
- Dtype:データ型
info()ではデータの大まかな情報を確認することができます
特に「データが欠損(Null)していない数」と「データ型」を一つのメソッドで確認することができるのが利点です
データ分析では「Null」のデータの扱いが非常に重要になってきます
事前に欠損値があるかどうか確認し、「0」で埋めるや「平均値」を入れるなどの対処を実施しましょう
infoの使い方
student_data.info()
非常にシンプルに記述することができ、指定のDataFrameにinfo()を付けるだけです
上記3つの情報のほかに、「インデックス数」や「カラム数」、「メモリ使用量」なども合わせて確認することができます
まとめ
今回はinfo()についてご紹介してきました
欠損値やデータ型は非常に重要な要素になってくるため、データ分析を始める前に確認する癖をつけておきましょう
基本統計量を確認するdescribe()も同時に使うことが多いため、こちらの記事もご覧ください
合わせて読まれてる記事
Thanks for your blog, nice to read. Do not stop.