( New ) 新連載スタート!2人の会話形式でPythonを学ぶ「週末Pythonゆる講座」はこちら ▶▶

【Python】サンプルデータをWebから取得する方法

Pythonでサンプルデータを取得する

Pythonでデータ分析を学習しようとするとき、簡単に取得できるサンプルデータがあればいいと思いませんか?

自分でExcelやCSVを用意するのは面倒だし、APIなど難しい手法を使ってWebからデータを取得するのも大変…

そんな時にSeabornというライブラリにプリセットされている「サンプルデータ」を利用すれば、一瞬でWebからデータを取得することができます

Pythonを勉強し始めた方から、機械学習を本格的に実装する方まで、利用しやすいデータセットの取得方法をご紹介します

事前準備

Seabornというライブラリを事前にインポートしておきます

import seaborn as sns

サンプルデータを取得する方法

サンプルデータを取得するにはload_datasetというメソッドを利用します

サンプルは様々な種類があり、「データセット名」を指定する必要があります

df = sns.load_dataset('データセット名')

データセット名の一覧

get_dataset_namesを利用すれば、データセット名を取得することができます

sns.get_dataset_names()
Python Seabornのサンプルデータのデータセット名一覧

それぞれがデータセットとして一連のデータを保持しています

続いて1つのデータセットをピックアップし、DataFrameに格納してみましょう

サンプルデータの取り出し

前述の通りload_datasetというメソッド を利用し、データセットをDataFrameに格納します

今回は機械学習の練習で有名や「タイタニック号の生存者」のデータセットを取り出してみましょう

df = sns.load_dataset('titanic')
df

とてもシンプルな記述でサンプルデータを取得することができました

これで様々なデータ加工を実施することができます

まとめ

今回はSeabornを使い、Webからサンプルデータを取得する方法をご紹介してきました

詳細は別の記事に書いているのでそちらを参照ください

1から始めるPythonデータ分析|やりたいこと逆引きリスト
お気に入り登録お願いします

コメントを残す

メールアドレスが公開されることはありません。