教師あり学習における交差検証とは?精度評価をわかりやすく解説

IT基礎

ハク
ハク

モデル作ったのに、本番だと当たらないんだけど…?

レイ
レイ

それ、過学習かもしれないですね。

ハク
ハク

えっ!?どうすればいいの?

レイ
レイ

そこで使うのが 「交差検証(クロスバリデーション)」です。

教師あり学習とは?

教師あり学習とは、

👉 正解データ(ラベル)付きで学習する方法です。

例:

  • 「このメールは迷惑メールか?」
  • 「この画像は猫か犬か?」

なぜ精度評価が難しいのか?

教師あり学習ではこんな問題が起きます👇

  • 学習データ → よく当たる
  • 新しいデータ → 当たらない

👉 これが 過学習(オーバーフィッティング)



交差検証とは?

交差検証とは、

👉 データを分けて、モデルの実力を正しく測る方法

です。


交差検証の仕組み(k分割)

例えば「5分割(k=5)」の場合👇

① データを5つに分ける
② 1つをテスト、残りで学習
③ これを5回繰り返す
④ 最後に平均を取る

👉 すべてのデータをテストに使えるのがポイント!

レイ
レイ

これで“たまたま当たっただけ”を防げるんですよ。

メリット

  • 精度評価が安定する
  • データの偏りを防げる
  • 本番に近い性能がわかる

デメリット

  • 計算コストが高い
  • データが少ないと分割しにくい

よく出る用語

  • 学習データ(トレーニングデータ)
  • テストデータ
  • k分割交差検証(k-fold)
レイ
レイ

教師あり学習では“精度評価の基本”です。

まとめ

交差検証とは、

👉 教師あり学習でモデルの性能を正しく評価するための方法

です。

👉 過学習を防ぐためにとても重要!

コメント

タイトルとURLをコピーしました