目次
英語の文字列の大文字・小文字を変更する
Pythonでデータ分析を実施する際、英語の文字列を操作する場合があります
その際、大文字と小文字が混在ことがありますが、メソッド一つで大文字・小文字を自由に変換することができます
変換の方法は4種類ありますが、それぞれにメソッドがあります
事前準備
Seabornというライブラリから、mpgという車のデータを取得しておきます
import seaborn as sns
df = sns.load_dataset('mpg')
df.head()
大文字・小文字を変換する方法
nameというカラムに入っている「車名」を使い、大文字・小文字変換を試してみます
既存データでは「すべて小文字」になっています
df['name']
① すべて大文字に変換(upper)
英字のすべてを大文字に変換するためにはupperメソッドを利用します
また文字列型のみが対象のためstrも合わせて使う必要があります
df['name'].str.upper()
② すべて小文字(lower)
英字を全て小文字にする場合はlowerを利用します
df['name'].str.lower()
③ 先頭だけ大文字(capitalize)
英文では基本的に最初の文字を大文字にしますが、capitalizeを使うと自動で先頭だけ大文字にすることができます
df['name'].str.capitalize()
④ 単語の先頭だけ大文字(title)
文の先頭だけではなく、単語の先頭を大文字に変更することも可能です
titleを利用します
df['name'].str.title()
※ 大文字と小文字を入れ替える(swapcase)
最後に補足としてswapcaseメソッドを利用して、大文字・小文字を入れ替える方法をご紹介します
あまり利用用途はないと思いますが、こういう機能があることは覚えておいてください
上記で説明したtitleを使い、最初の単語を大文字にした後に入れ替えを行っています
df['name'].str.title().str.swapcase()
まとめ
今回はPythonで英字を扱う際に、大文字・小文字を変換する方法をご紹介してきました
先頭だけ大文字にしたり、単語の先頭だけ変えたり自由に操作が可能です
それぞれにメソッドが異なるので注意してください
またstrを使わないとエラーが出てしまうのも念頭に置きましょう