
目次
いきなり実践から始めよ

さて、前回はPython(Google Colaboratory)のノートブックの使い方についてご紹介しました
今回はExcelのデータを読み取って、Pythonで操作する方法をご説明していきます

さっそく実践ができるんですね!

Pythonに関する本を見ると、基礎から説明しているものを多く見かけるけど
初心者は利用イメージが湧かないため挫折してしまう・・・

実は本屋で立ち読みしたんですが、難しくてそっと閉じました・・・

Pythonが分かる人向けに「分かりにくく」書かれている本がほんとに多い・・・

独学でやろうとしたらすぐ挫折していました・・・

なので実際のデータで実践していくことで、Pythonを使うイメージを持ってもらいます

実践しているうちに、やりたいことができない場面が訪れるはずなので
その時に基礎を学べばよいと思っています!

スポーツでも、まずは試合に出て楽しさを実感してから、基礎練習をやるのに似ていますね!

その通り!だから実際のデータを使ってPythonを学んでいきましょう
Excelを読み取る

さっそくExcelのデータを読み取ってみましょう!
まずはサンプルのデータをダウンロードしてください!

ダウンロードできました!

もちろんお手元のExcelデータでも大丈夫ですよ!

持っているExcelデータもあとで試してみます!

まずはExcelをGoogle Driveのどこかのフォルダに入れて、Google Colaboratoryとの連携をします
そこからは記事の通りに進めてください


連携までできました!そこからどうすればよいですか??

ExcelをPythonで読み取るにはread_excelを使います

Google Driveのパスを()括弧の中に記載しましょう
※パスの場所が違うと思うので***の部分を変えてください!
pd.read_excel('/content/drive/MyDrive/***/student.xlsx')

あれ!?コードをコピーして実行しても、エラーが出てしまいました!?


あ、しまった。Pandasをインポートするの忘れていました

パンダス?パンダのことですか??

read_excelの機能が入っているライブラリをPandasと呼びます
Pythonでは1から関数や仕組みを作る必要はなく、あらかじめ用意されている機能を使うことができます!

ライブラリ?いまいちまだ理解できていません・・・

例えば「スマホ」を使うときに、「アプリ」をダウンロードしますよね?
それに似ていて、やりたいことに応じて「ライブラリ」をインポートします!

なるほど、それはイメージできます!

「スマホ」にデフォルトの機能があるように、「Python」だけでも単純な計算やデータを扱うことができます
一方でライブラリをインポートすることで、より高度な分析やキレイなグラフを作ることが可能です!

今回はPandasというライブラリ(アプリ?)をインポートするんですね!
そもそもPandasは何ができるんですか?

Pandasはデータ分析ができるライブラリです!
利用するためには下記コードを書くだけでOK
import pandas as pd

細かいところなんですが、pdって何ですか?

Pandasの略がpdで慣例としてこのように使うことが多いです
頭に付けて機能を使っていきます!

だからpd.read_excelとなっていたんですね!
これで改めて実行します!


うまくデータが出ましたー!!!!

簡単にExcelのデータをPythonで読み取ることができましたね!

思ったより簡単でした!もっと複雑にコードを書くのかと思いました・・・

Jupyter Notebookを使っている方で、Pythonが同じパスに入っているときはファイル名だけでも大丈夫です!
pd.read_excel('student.xlsx')
変数を使いこなす!

よーし!さっそくデータ分析していくぞー!

いいね!データの表を見て、分析のイメージができてきたのかな
ただその前に非常に重要な「変数」を覚えて欲しい!

へんすう?? おかしな数字ってことですか?

全然違う・・・
「変数」とは簡単に言うと「名前が付いている箱」です!

箱?プログラミングで箱を使うんですか??

そう、箱に入れておくことで「追加」や「変更」が自由にできるんだ
また繰り返し使うときも楽に書ける!

うーん、分かるような、分からないような・・・

ルールさえ守れば非常に便利な機能だから覚えて欲しい
- 変数名は自由につけてOK(Pythonのデフォルト機能と被っているものはNG)
- 変数名(名前の付いた箱)を左に、=イコールを挟んで、入れたい内容を右に書く

=イコールを書くので「同じ」という意味に思ってしまいますが、変数という箱に代入するイメージです

変数の中に入れる!ですね!

「a」と「b」という名前の付いた箱(変数)に、数字を入れてみましょう

では「a」には10を、「b」には20を入れてみました!
これで合ってますか?
a = 10
b = 20

合ってます!それでは「a」+「b」をやってみましょう


お、あれ。30が出てきた・・・

「a」の箱(変数)には10が入っていて、「b」には20が入っていました
足せば30になりますよね!

まあ、当たり前な気もしますが・・・

ちなみに下記のようなコードを書くと、自分自身の変数も更新することができます
a = a + b

これだと「a」が10から30になるんですかね!?

そのとおり!変数のイメージはできてきましたね!
Excelデータも変数に入れる!?

実は先ほどのExcelで読み取ったデータも変数に入れることができます!

表も変数に入れられるんですか??

そう、データ分析は変数をどんどん作っていって進めていきます!

どんなふうに箱に入れるんですか?

全く同じですよ!
これもPythonの慣例ですが「df」という変数を使っていきます
df = pd.read_excel('/content/drive/MyDrive/***/student.xlsx')

「df」にデータを入れることができました
でも表がでません・・・

上のコードでは変数にread_excelの情報を入れているだけなので、特に結果が出力されません
変数「df」に対して、始めの5行を出力するheadを使ってみましょう
※.ピリオドを忘れずに


やった、データが出ました!

この変数をまた別の変数に入れたりして、データの追加や集計を行っていきます


流れはイメージできました!

今回はここまでにしましょう!次からテストのデータをいじっていきますよ!
read_excelについての細かい説明は記事をご覧ください!

まとめ
- read_excelでExcelデータを読み取ることができる
- 変数は名前の付いた箱
- 読み取ったExcelのデータも変数に入れることができる
