大阪工業大学 情報科学部 宇宙物理研究室 2008年度 卒業研究
「主成分分析と因子分析による競馬の勝因の研究」
学籍番号A04-133 情報科学科 名前 邉見 広大
2009/2/12 作成
概要 / 目次 / 卒業論文、プログラム/
概要
主成分分析と因子分析を用いて、毎年12月に中山競馬場で行なわれる有馬記念のレース結果を予想した。主成分分析とは、勝因と考えられるいくつかの要素を線形結合し、相関行列の固有ベクトルを用いる分析である。因子分析とは、任意の主要素を求める際に、各要素の残余項を最小にするように求める分析である。主成分分析と因子分析の結果から、競馬で予想の時に用いられるデータのどれが実際に影響して良い成績を残したのかを調べ、2008年の有馬記念の出走馬に適用した。 データは、過去4年分の有馬記念の出走馬の成績と、過去4年分の中山競馬場2500mのレースで勝った馬の成績を標準化して用い、成績データは、右回り、左回り、競馬場、距離、GI、重賞競争の成績(1着、2着、3着、着外)の結果から3要素を決め、主成分得点、因子得点を計算するプログラムをC言語で作成した。要素を変えながら図示し、最も相関があると考えられる3要素を探した。 図1、2は過去の有馬記念から、右回りと競馬場を組み合わせ、距離、GIと重賞組み合わせた3要素をとり主成分得点と因子得点の図示し、2008年の有馬記念を予想に用いたものである。主成分分析と因子分析は同様に分布するが、主成分分析はデータが楕円状に分布し、因子分析はデータが円状に分布する事がわかった。どちらも分析固有の性質が明確に出た。図1の第1主成分得点は3つの要素が高い馬がプラスを表し、第2主成分得点はマイナスなcら距離の要素が高く、プラスなら残りの要素が高いことを表した。図2の第1因子得点は、距離以外の要素で説明でき、第2因子は距離の要素だけで説明できた。 主成分、因子分析ともに右上のほうに集まるように相関が見えるため、2008年の有馬記念の予想は馬番の順に6番、9番、11番、13番で、特に主成分、因子ともに右上に来ている9番と13番が勝つ確率が高いという結果になった。実際のレースの結果は1着から13番、14番、6番の順であった。研究結果から、2頭入選したことになった。
図1.主成分分析の散布図 図2.因子分析の散布図
目次
- 序論
1.1 背景
1.2 本研究の内容
1.3 本論文の構成
- 主成分分析
2.1 合成変量の構成
2.2 合成変量の分散の最大化
2.3 寄与率
2.4 標準化
2.4.1 変量の標準化
2.4.2 新変量の分散共分散行列
- 因子分析
3.1 因子分析の構成
3.2 相関行列の分解
3.3 因子負荷量の推定方法
3.4 共通性と独自性
3.5 単純化構造の発見
3.5.1 単純化構造の説明
3.5.2 基準バリマックス法
3.6 因子得点の推定方法
- 分析の方法
4.1 計算プログラムについて
4.2 計算方法
- 結果
5.1 中山2500mを用いての結果
5.1.1 中山2500mの主成分分析の結果
5.1.2 中山2500mの因子分析の結果
5.1.3 中山2500mからの結果の考察
5.2 過去有馬記念を用いての結果1
5.2.1 過去有馬記念の主成分分析の結果1
5.2.2 過去有馬記念を用いての因子分析の結果1
5.2.3 過去有馬記念からの結果の考察1
5.3 過去有馬記念を用いての結果1
5.3.1 過去有馬記念の主成分分析の結果1
5.3.2 過去有馬記念を用いての因子分析の結果1
5.3.3 過去有馬記念からの結果の考察1
5.4 研究の結果と実際の結果
- まとめと展望
卒業論文、プログラム
卒業論文 [pdf] (4.0MB)
Copyright (c) 邉見 広大 kodai Henmi 2009. All rights reserved.