Discussion:
Vægtning i regression
(for gammel til at besvare)
Peter1952
2006-10-31 15:37:09 UTC
Permalink
Kan man vægte for de forskellige rækker i en regression i excell?

Mere præcist

Jeg har eksempelvis flg

1. Inddata

År Antal (n) medianløn

1 10 17817
2 174 21100
3 338 23396
4 302 25508
5 433 25539
6 425 26463
7 236 28140
8 215 25711


Jeg ved godt hvordan jeg får lavet en trediegrads polynomisk
regression ud
fra kolonne 1 (år) så kolonne 3 (medianløn) bliver "udjævnet".
(Interesserede kan se nærmere om metoderne i tråden "Formler for
polynomiske
tendenslinier" fra januar 06 i denne gruppe, som er guld værd for mig)

Mit problem er om man i excell kan lave en vægtning (ud fra kolonne 2,
"antal"), så der tages hensyn til at der ikke er lige mange
observationer i
hvert af årene. Eller om man er nødt til at ty til SAS for at lave
det.
Mit problem er at jeg har travl, aldrig har prøvet SAS og at min
SAS-programmør aldrig har prøvet af lave ProcReg (måske er der
SAS-hajer i
gruppen som kunne give en hånd?)

Peter Lyngse
Hans Terkelsen
2006-11-01 15:59:16 UTC
Permalink
"Peter1952" <***@mail.dk> wrote in message news:***@i42g2000cwa.googlegroups.com...
Kan man vægte for de forskellige rækker i en regression i excell?

Mere præcist

Jeg har eksempelvis flg

1. Inddata

År Antal (n) medianløn

1 10 17817
2 174 21100
3 338 23396
4 302 25508
5 433 25539
6 425 26463
7 236 28140
8 215 25711


Jeg ved godt hvordan jeg får lavet en trediegrads polynomisk
regression ud
fra kolonne 1 (år) så kolonne 3 (medianløn) bliver "udjævnet".
(Interesserede kan se nærmere om metoderne i tråden "Formler for
polynomiske
tendenslinier" fra januar 06 i denne gruppe, som er guld værd for mig)

Mit problem er om man i excell kan lave en vægtning (ud fra kolonne 2,
"antal"), så der tages hensyn til at der ikke er lige mange
observationer i
hvert af årene. Eller om man er nødt til at ty til SAS for at lave
det.
Mit problem er at jeg har travl, aldrig har prøvet SAS og at min
SAS-programmør aldrig har prøvet af lave ProcReg (måske er der
SAS-hajer i
gruppen som kunne give en hånd?)

Peter Lyngse


Hej Peter.

Heller ikke jeg kan se nogen direkte vægtningsmulighed.
Så nedenst. bliver en 'brute force' Excel løsning.
Jeg ville gerne have gemt regningerne i en fiks matrix-formel,
men det lykkedes ikke.

For at få vægtet i forhold til personantal n, gentages datasættene.
10 gange for første linje, 174 for næste osv.
Virkelig den brutale vej.

I A1:D9

x år n y løn 0
1 10 17817 10
2 174 21100 184
3 338 23396 522
4 302 25508 824
5 433 25539 1257
6 425 26463 1682
7 236 28140 1918
8 215 25711 2133

D1 er =SUM($B$1:B1) og kopieret ned

Nyt datasæt med gentagelser:

I A15
=SLÅ.OP(RÆKKE()-15;$D$1:$D$9;A$2:A$10)
Kopier ned til der kommer nuller i A2148.

Kopier A15:A2147 over i C15.

Nu er der to lange x og y søjler, A15:A2147 og C15:C2147
til regressionsfunktionen LINREGR med vægtning af data.

Man får
~2000 rk: y = -36.259*x^4 + 691.01*x^3 - 4836.6*x^2 + 15749*x + 4203.1
8 rk: y = -24.222*x^4 + 432.19*x^3 - 2884.8*x^2 + 9758.2*x + 10403

Formlerne er bare kopieret fra grafens trend-linje

Der er en vilkårlighed i hvor højt man går op med polynomium graden
Jeg tog 4 fordi kurven lignede et 4. grads polynomium
Ellers ville man måske vælge 2
Med et 7. grads polynomium kan man få kurven til at passe med alle 8 punkter,
uanset om der vægtes!

Statistik skal tages med et gran talfornemmelse
Der er usikkerhed på tallene, og usikkerhed på usikkerhederne :-)

Hilsen Hans.

Loading...