Regresión Polinómica

Algunos fenómenos resultan ser mejor representados por un polinomio y aunque a veces puede no ser particularmente "natural", es decir, aquella que expresa una relación de causa y efecto entre las variables; sin embargo, es tan flexible y tan fácilmente manejable en forma matemática, que resulta de gran utilidad.

Polinom.jpg (14095 bytes)

El problema consiste en encontrar los coeficientes de los términos en las ecuaciones, que darán un polinomio que cumplirá el requisito de que la suma de cuadrados sea mínima. Para esto se hará uso de las "ecuaciones normales". Se necesitara tantas ecuaciones como coeficientes haya, o una mas que el grado de la ecuación que se quiera ajustar.

Las ecuaciones normales son:

polin1.jpg (24824 bytes)

Los puntos suspensivos sugieren la posibilidad de expandir las formulas siguiendo el mismo patrón. Como ilustración se correrá un ejemplo ajustando la curva a tercer grado (cúbica).

Respuesta a la Fertilización Nitrogenada en palmas de vivero (Datos hipotéticos) x = g de N y = Long. de la hoja

x y y2 x2 x3 x4 x5 x6 xy x2y x3y
0 27.4 750.8 0 0 0 0 0 0 0 0
4 39.3 1544.5 16 64 256 1024 4096 157.2 628.8 2515.2
7 46.2 2134.4 49 343 2401 16807 117649 323.4 2263.8 15846.6
10 47.8 2284.8 100 1000 10000 100000 1000000 478.0 4780 47800
13 44.5 1980.3 169 2197 28561 371293 4826809 578.5 7520.5 97766.5
18 24.5 600.3 324 5832 104976 1889568 34012224 441.0 7938 142884
52 229.7 9295 58 9436 146194 2378692 39960778 1978.1 23131.1 306812

Sustituyendo los valores observados se obtiene el siguiente sistema de ecuaciones :

6a      + 52b        + 658c       + 9436d         = 229.7         A
52a    + 658b     + 9436c       + 146194d    = 1978.1       B
658a  + 9436b   + 146194c   + 2378692d   = 23131.1     C
9436a + 14194b + 2378692c + 39960778d = 306812.3  D

Para resolver, primero se eliminara a: Multiplicando la ecuación B por 6 y la ecuación A por 52 y sacando la diferencia se tiene :

1244 + 22400c + 386492d = -75.8   E

La ecuación C multiplicada por 6, menos la A multiplicada por 658, da :

22400b + 444200c + 8063264d = -12356   F

La ecuación D multiplicada por 6, menos la ecuación A multiplicada por 9436, da :

386492b + 8063264c + 150726572d = -326575.4   G

Ahora se eliminara b.

La ecuación F multiplicada por 1244 menos la ecuación E multiplicada por 22400, da :

50824800c + 1373279616d = -13672944   H

La ecuación G multiplicada por 1244 menos la ecuación E multiplicada por 386492 da:

1373279616c + 38127789500d = -276963704    I

Ahora se procede a eliminar c.

La ecuación H multiplicada por 1373279616 menos la ecuación I multiplicada por 50824800 y dividiendo ambos miembros entre 10000000 para simplificar las cifras, resulta:

5194037206d  =  -38232948
                  d   =  -0.00736

Sustituyendo d en la ecuación H y resolviendo:

50824800c + 1373279616 (-0.00736) = -13672944
                50824800c - 10107337.97 = -13672944
                                      50824800c = -13672944 + 10107337.97
                                                    c = -35655606 /50824800
                                                    c = -0.07015

Sustituyendo d y c en la ecuación E y resolviendo :

1244b + 22400 (-0.07015) + 386492 (-0.00736) = -75.8
1244b - 1571.4 - 2844.6 = -75.8
                          1244b = -75.8 + 1571.4 + 2844.6
                                 b = 4340 /1244
                                 b = 3.4889

Y finalmente sustituyendo b, c y d en la ecuación A se tiene:

6a + 52(3.4889)+658(-0.07015) + 9436 (-0.00736) = 229.7
6a + 181.4 - 46.158 - 69.449 = 229.7
6a = 229.7 - 181.4 + 46.158 + 69.449
  a = 163.907 /6
  a = 27.318

Y entonces el polinomio quedaría así :

y = 27.318 + 3.4889X - 0.07015X2 - 0.00736X3

Para facilitar el cálculo de la suma de cuadrados conviene definir las siguientes variables :

polin2.jpg (10566 bytes)

La suma de cuadrados de la regresión y totales se define así :

polin3.jpg (10771 bytes)

SCR = 3.4888 (-12.63)+(-0.07015)(-2059.33)+(-0.00736)(-54429.23)
        = -44.06 + 144.46 + 400.6
        = 501

SCT = 9295.03 - (229.7)2/6
        = 501.35

El coeficiente de determinación es :

R2 = SCR/SCT = 501/501.35 = 0.999

Lo que significa un ajuste casi perfecto.