2020-08-01から1ヶ月間の記事一覧

本日のまとめ(アンサンブル学習)

アンサンブル学習 様座な分類器を1つのメタ分類器として組み合わせる。 最もよく使われるのは多数決(majority voting) 2値分類問題で1つの誤分類率が0.25の分類器を11個組み合わせた場合、6個以上(過半数)が間違える確率は0.034となる(具体的な計算は…

本日のまとめ(モデルの評価、チューニング)

パイプラインによるワークフローの効率化 make_pipelineは、入力としてsklearnの変換器(ex.StandardScaler, PCA)と、推定器(ex. LogisticRegression)を受け取る 変換器はいくつ指定してもよい 変換器は、fit & transform, 推定器はfit & predictをもつ pipe…

本日のまとめ

線形判別分析による教師ありデータ圧縮 線形判別分析(Linear Discriminant Analysis).PCAは分散が最も大きい直工成分軸を見つけるのに対し、LDAはクラスの分離を最適化する特徴部分空間を見つけ出す LDAは教師ありのアルゴリズム。そのため、一般的にはこち…

本日のまとめ

特徴抽出の方法 次元削減による特徴抽出の主な方法は以下の3つ - 教師なしデータ圧縮での主成分分析 - クラスの分離を最大化する教師あり次元削減法としての線形判別分析(LDA) - カーネル主成分分析(KPCA)による非線形次元削減 主成分分析による教師なし次元…