カテゴリ:機械学習
sample.ipynb
ワインのデータを以下で読み込む。
from sklearn.datasets import load_wine
data_wine = load_wine()
data_wine
data_wineは以下から成る
data_wine.data:ワインの成分
data_wine.feature_names:ワインの成分の列名
data_wine.target:ワインの種類
このデータをランダムフォレストで学習し、ワインの分類に重要な項目は何かを調べよ。
ヒント
DataFrameにdata_wine.dataを列名付きで読み込む例:
import pandas as pd
df = pd.DataFrame(data_wine.data,columns=data_wine.feature_names)
df.head()
列名(feature_names)について
'alcohol': 'アルコール',
'malic_acid': 'リンゴ酸',
'ash': '灰分',
'alcalinity_of_ash': '灰のアルカリ度',
'magnesium': 'マグネシウム',
'total_phenols': '総フェノール',
'flavanoids': 'フラボノイド',
'nonflavanoid_phenols': '非フラボノイドフェノール',
'proanthocyanins': 'プロアントシアニン',
'color_intensity': '色の濃さ',
'hue': '色相',
'od280/od315_of_diluted_wines': 'OD280/OD315比(希釈ワイン)',
'proline': 'プロリン'