
ハク
モデル作ったのに、本番だと当たらないんだけど…?

レイ
それ、過学習かもしれないですね。

ハク
えっ!?どうすればいいの?

レイ
そこで使うのが 「交差検証(クロスバリデーション)」です。
教師あり学習とは?
教師あり学習とは、
👉 正解データ(ラベル)付きで学習する方法です。
例:
- 「このメールは迷惑メールか?」
- 「この画像は猫か犬か?」
なぜ精度評価が難しいのか?
教師あり学習ではこんな問題が起きます👇
- 学習データ → よく当たる
- 新しいデータ → 当たらない
👉 これが 過学習(オーバーフィッティング)
交差検証とは?
交差検証とは、
👉 データを分けて、モデルの実力を正しく測る方法
です。
交差検証の仕組み(k分割)
例えば「5分割(k=5)」の場合👇
① データを5つに分ける
② 1つをテスト、残りで学習
③ これを5回繰り返す
④ 最後に平均を取る
👉 すべてのデータをテストに使えるのがポイント!


レイ
これで“たまたま当たっただけ”を防げるんですよ。
メリット
- 精度評価が安定する
- データの偏りを防げる
- 本番に近い性能がわかる
デメリット
- 計算コストが高い
- データが少ないと分割しにくい
よく出る用語
- 学習データ(トレーニングデータ)
- テストデータ
- k分割交差検証(k-fold)

レイ
教師あり学習では“精度評価の基本”です。
まとめ
交差検証とは、
👉 教師あり学習でモデルの性能を正しく評価するための方法
です。
👉 過学習を防ぐためにとても重要!


コメント