jueves, 5 de septiembre de 2013

2. La correlación estadística entre variables ¿Cómo se recogen los datos y cómo se entienden las correlaciones?

El tratamiento estadístico comienza con la recogida desde la página web oficial del PGA TOUR de los datos de todos los jugadores en los últimos 5 años.
Cada aspecto del juego (media de golpes, distancia con el drive, greens en regulación, recuperaciones, etc...) representa una variable.

Una vez ordenadas todas las variables recogidas se someten a un análisis descriptivo que nos ofrecerá la media y desviación típica de cada variable lo que nos ofrecerá los valores de élite.
Se analiza cada variable con la prueba de normalidad de Kormogorov-Smirnov para determinar si la distribución de cada variable es una distribución normal. Se rechazará la normalidad de la distribución de datos de una variable cuando el estadístico de contraste de la prueba es menor que 0.100.
Posteriormente se analizan las correlaciones estadísticas entre variables con la media de golpes para conocer que variables influyen más o menos en resultado final. Si las dos variables analizadas tienen una distribución normal, la correlación se calcula con el coeficiente de correlación de Pearson. Si una de las dos variables no presenta una distribución normal se utilizará la Rho de Spearman para calcular la correlación. Se considera una correlación significativa cuando el estadístico de contraste es menor que 0,050 y en tal caso se ofrece el valor de la correlación entre -1 y 1.

La correlación estadística entre dos variables ofrece  valores entre “0” y “1”. Un valor de “1” significa que un aumento en una de las variables producirá un aumento idéntico en la otra variable (o una disminución idéntica si el valor es negativo). Un valor de “0” ofrece una correlación nula entre las variables. Valores cercanos a “1” ó “-1” ofrecen una correlación fuerte.

 

No hay comentarios:

Publicar un comentario