Lineær regression

Bedste rette linje gennem datapunkter

Lineær regression finder den "bedst passende" rette linje \(\hat{y} = ax + b\) gennem et datasæt. Linjen minimerer summen af de kvadrerede afvigelser — metoden hedder mindste kvadraters metode.

Korrelationskoefficienten \(r\) angiver styrken af den lineære sammenhæng: \(|r|\) nær 1 = stærk, nær 0 = svag. \(R^2 = r^2\) er forklaringsgraden — andelen af variation forklaret af modellen.

Brug altid lommeregneren/CAS til at beregne \(a\), \(b\) og \(r\). Det vigtige er at fortolke resultaterne i konteksten.

Formler

Regressionslinje
\(\hat{y} = ax+b\) (mindste kvadraters metode)
Korrelationskoefficient
\(r \in [-1,1]\). \(|r|\) tæt på 1 = stærk lineær sammenhæng.
Forklaringsgrad
\(R^2 = r^2\). Angiver hvor stor en andel af variationen der forklares.

Eksempler

EksempelDatasæt med \(r=0{,}97\)
1
Fortolk
\(r=0{,}97\) tæt på 1 → stærk positiv lineær sammenhæng.
\(R^2 = 0{,}94\) → 94% af variationen forklares af modellen.
Eksempel 2Fortolkning: \(\hat{y} = 2{,}3x + 14{,}5\), \(r = 0{,}94\)
1
Hældning
For hver ekstra enhed i x stiger y med \(2{,}3\) enheder
2
Korrelation
\(r = 0{,}94\) — stærk positiv lineær sammenhæng
3
Forudsigelse ved \(x=10\)
\(\hat{y} = 2{,}3\cdot10 + 14{,}5 = \textcolor{#ef4444}{37{,}5}\)
Eksempel 3 — kausalitet\(r = 0{,}89\) mellem is-salg og druknedøde. Hvad betyder det?
1
Stærk positiv korrelation
\(r = 0{,}89\) tyder på stærk lineær sammenhæng
2
Men: korrelation er IKKE kausalitet!
Begge skyldes en tredje faktor — varmt vejr. Is-salg forårsager ikke druknedøde. Regression beskriver sammenhæng, ikke årsag.
💡 Tip: Brug altid CAS/lommeregner til at bestemme a, b og r. Husk at fortolke a og b i konteksten.

Genkend opgavetypen

🔍 Sådan ser den ud til eksamen
  • Find \(a\) og \(b\) i \(\hat{y}=ax+b\) med regression på lommeregneren
  • Korrelationskoefficient \(r\): tæt på \(\pm 1\) = stærk sammenhæng, tæt på 0 = svag
  • Fortolkning: \(a\) angiver ændring i y pr. enhed i x
⚠️ Klassiske eksamensfejl
  • \(r^2\) er determinationskoefficienten — \(r\) er selve korrelationskoefficienten
  • Kun lineær regression kan bruges — tjek om punktskyen ligner en ret linje
  • Ekstrapolation: brug ikke modellen langt uden for dataintervallet
Træn Lineær regression med uendelige opgaver

Opgaverne genereres med nye tal hver gang, og du får øjeblikkelig feedback med trin-for-trin-forklaringer. Gratis at prøve.

Træn Lineær regression →