動作検証バージョン:Windows 11 Home + Python 3.10.6 + Jupyter Notebook 6.5.3 + seaborn 0.12.2 + pandas 2.0.3
Pythonの外部ライブラリ「seaborn(シーボーン)」には、サンプル用のデータセットが複数用意されています。
グラフを作成するには何らかのデータを準備しなければなりませんから、こういったデータセットが用意されているのは、とてもありがたいと感じます。
[スポンサードリンク]
seaborn.get_dataset_names関数でデータセット名を取得
seabornに用意されているデータセットの名前は、seaborn.get_dataset_names関数を使うと、Pythonのリストとして取得できます。
import seaborn as sns
get_dataset_names()
get_dataset_names()
上記のコードをJupyterで実行すれば、seabornに以下のようなデータセットが用意されていることを確認できます。
['anagrams',
'anscombe',
'attention',
'brain_networks',
'car_crashes',
'diamonds',
'dots',
'dowjones',
'exercise',
'flights',
'fmri',
'geyser',
'glue',
'healthexp',
'iris',
'mpg',
'penguins',
'planets',
'seaice',
'taxis',
'tips',
'titanic']
pandasDataFrame.infoメソッドでデータセットの情報を出力
seaborn.load_dataset関数を使って、DataFrameとして読み込んでやれば、pandasのDataFrame.infoメソッドを使って、どのようなデータセットなのか詳細を知ることができます。
たとえば、別名snsでseabornがインンポートされているときに、以下のようなコードを実行すると、
df = sns.load_dataset('iris')
df.info()
df.info()
フィッシャーのアヤメデータについて、以下のような出力が得られます。
RangeIndex: 150 entries, 0 to 149
Data columns (total 5 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 sepal_length 150 non-null float64
1 sepal_width 150 non-null float64
2 petal_length 150 non-null float64
3 petal_width 150 non-null float64
4 species 150 non-null object
dtypes: float64(4), object(1)
memory usage: 6.0+ KB
[スポンサードリンク]
Home » Python » seabornの使い方 » seabornデータセットの情報を取得する-pandas.DataFrame.infoメソッド