이 포스팅은 시각화 정리 시리즈 16 편 중 11 번째 글 입니다.
두 변수간의 관계를 한눈에 파악할 수 있는 Pair plot을 알아본다.
연습 kaggle notebook
# Useful for:
# Plot pairwise relationships in a dataset.
# Helps you to see in a glance of an eye all distribution and correlation of variables.
# More info:
# https://seaborn.pydata.org/generated/seaborn.pairplot.html
# ----------------------------------------------------------------------------------------------------
# get the data
df = sns.load_dataset('iris')
# plot the data using seaborn
# hue = 색조, 이 변수에 내가 원하는 그룹의 변수를 적어주면 된다.
# 이 부분을 안하면, 대각원소에는 히스토그램이 그려진다.
sns.pairplot(df,
hue = "species" # helps to separate the values by specios
);
각각의 산점도에 종마다 회귀선을 그려보자.
# Useful for:
# Plot pairwise relationships in a dataset.
# Helps you to see in a glance of an eye all distribution and correlation of variables.
# This plot also plots a regression line to fit each of the data
# More info:
# https://seaborn.pydata.org/generated/seaborn.pairplot.html
# ----------------------------------------------------------------------------------------------------
# get the data
df = sns.load_dataset('iris')
# plot the data using seaborn
sns.pairplot(df,
kind = "reg", # make a regression line for eac hue and each variables
hue = "species"
);