目次
Pythonでサンプルデータを取得する
Pythonでデータ分析を学習しようとするとき、簡単に取得できるサンプルデータがあればいいと思いませんか?
自分でExcelやCSVを用意するのは面倒だし、APIなど難しい手法を使ってWebからデータを取得するのも大変…
そんな時にSeabornというライブラリにプリセットされている「サンプルデータ」を利用すれば、一瞬でWebからデータを取得することができます
Pythonを勉強し始めた方から、機械学習を本格的に実装する方まで、利用しやすいデータセットの取得方法をご紹介します
事前準備
Seabornというライブラリを事前にインポートしておきます
import seaborn as sns
サンプルデータを取得する方法
サンプルデータを取得するにはload_datasetというメソッドを利用します
サンプルは様々な種類があり、「データセット名」を指定する必要があります
df = sns.load_dataset('データセット名')
データセット名の一覧
get_dataset_namesを利用すれば、データセット名を取得することができます
sns.get_dataset_names()
それぞれがデータセットとして一連のデータを保持しています
続いて1つのデータセットをピックアップし、DataFrameに格納してみましょう
サンプルデータの取り出し
前述の通りload_datasetというメソッド を利用し、データセットをDataFrameに格納します
今回は機械学習の練習で有名や「タイタニック号の生存者」のデータセットを取り出してみましょう
df = sns.load_dataset('titanic')
df
とてもシンプルな記述でサンプルデータを取得することができました
これで様々なデータ加工を実施することができます
まとめ
今回はSeabornを使い、Webからサンプルデータを取得する方法をご紹介してきました
詳細は別の記事に書いているのでそちらを参照ください
1から始めるPythonデータ分析|やりたいこと逆引きリスト