カテゴリ:データサイエンス
箱ひげ図の箱の大きさの1.5倍以上、箱から離れているものを外れ値と見なします。
箱の大きさ=第三四分位点-第一四分位点
箱の下辺=第一四分位点
箱の上辺=第三四分位点
# 第一四分位点
q1= df["失点"].quantile(0.25)
# 第三四分位点
q3= df["失点"].quantile(0.75)
# 箱の範囲
hako = q3 - q1
# 下限
min = q1 - hako * 1.5
print('これより下は外れ値', min)
# 上限
max = q3 + hako * 1.5
print('これより上は外れ値', max)