( New ) 新連載スタート!2人の会話形式でPythonを学ぶ「週末Pythonゆる講座」はこちら ▶▶

【Python】info|データの要約を確認する方法

事前準備

Pandas」というデータ解析を実施できるライブラリをインポートします 

import pandas as pd

サンプル:学校データ

学校のイメージ画像
student_data.head()
学校のテストデータのイメージ

infoとは?

info()メソッドを使うことで、データの要約情報を取得することができます

取得できる情報は下記3項目です

  • Column:カラム名
  • Non-Null Count:データがある行数
  • Dtype:データ型
python infoメソッドのイメージ

info()ではデータの大まかな情報を確認することができます

特に「データが欠損(Null)していない数」と「データ型」を一つのメソッドで確認することができるのが利点です

データ分析では「Null」のデータの扱いが非常に重要になってきます

事前に欠損値があるかどうか確認し、「0」で埋めるや「平均値」を入れるなどの対処を実施しましょう

infoの使い方

student_data.info()
student_data.info()

非常にシンプルに記述することができ、指定のDataFrameにinfo()を付けるだけです

上記3つの情報のほかに、「インデックス数」や「カラム数」、「メモリ使用量」なども合わせて確認することができます

まとめ

今回はinfo()についてご紹介してきました

欠損値やデータ型は非常に重要な要素になってくるため、データ分析を始める前に確認する癖をつけておきましょう

基本統計量を確認するdescribe()も同時に使うことが多いため、こちらの記事もご覧ください

お気に入り登録お願いします

1 COMMENT

コメントを残す

メールアドレスが公開されることはありません。