Hvad Er En Falsk Sammenhæng? : Definition Og Eksempler

Falske sammenhænge kan forekomme i statistik, når to eller flere variabler ser ud til at have en årsag-virkning-sammenhæng med hinanden. Disse typer korrelationer har dog sjældent en sand årsagssammenhæng, selvom de ser ud til at have det. Derudover kan falske korrelationer give dig en bedre forståelse af et datasæts karakteristika og adfærd. I denne artikel vil vi undersøge, hvad falsk korrelation er, hvordan den relaterer til årsagssammenhæng, og hvordan man identificerer en falsk korrelation med nogle eksempler for yderligere indsigt i denne statistiske sammenhæng.

Hvad er en falsk sammenhæng?

En falsk korrelation i statistik repræsenterer en forbindelse mellem to variabler, der ser ud til at være en årsagssammenhæng, men som i virkeligheden ikke er det. En kausal sammenhæng beskriver en årsagssammenhæng mellem to variable, hvor den ene variabel gør noget, der direkte påvirker den anden. I en falsk sammenhæng er det, der ser ud til at være et årsag-og-virkningsforhold mellem to variable, ofte et tilfældigt forhold eller på grund af en tredje forvirrende faktor, der påvirker begge variabler.

For eksempel, hvis du bemærker, at både omkostningerne ved videregående uddannelse og leveomkostningerne stiger, betyder denne ændring i begge variabler ikke nødvendigvis, at der er en årsagssammenhæng mellem de to. Det betyder, at stigningen i leveomkostningerne ikke nødvendigvis er årsagen til stigningen i undervisningen på videregående uddannelser. I dette eksempel kan du tilskrive ændringen i begge omkostninger til stigningen i inflationen eller andre makroøkonomiske faktorer, hvilket resulterer i en falsk korrelation med en forvirrende faktor.

Selvom falske korrelationer ser ud til at have en forbindelsesfaktor, betyder korrelationerne ikke altid årsagssammenhæng. For bedre at forstå, hvordan falske sammenhænge kan opstå i statistiske undersøgelser, er det vigtigt at forstå sondringen mellem en korrelativ og en kausal sammenhæng.

Relateret: Hvad er korrelation? (Med definition og eksempler)

Korrelation versus årsagssammenhæng

I statistik kan du analysere sammenhænge og adfærd for flere variabler for at få indsigt i din undersøgelse. Relationerne, der opstår mellem variabler i denne forstand, er korrelative eller kausale og kan være direkte relateret til hinanden eller overhovedet ikke have nogen egentlig forbindelse:

Korrelation

En korrelation er et mål for retningen og størrelsen af ​​to eller flere variabler i et datasæt. Det betyder, at når man ser på statistiske modeller, hvis en variabel ændrer sig eller bevæger sig i en bestemt retning, så gør en anden variabel det også. Når adfærd som denne optræder mellem variabler i undersøgelser, antager statistikere en sammenhæng eller sammenhæng mellem prøverne. Tre primære typer af korrelationer kan forekomme i enhver given undersøgelse:

  • Positive korrelationer repræsenterer en positiv ændring i én variabel på grund af en anden.
  • Negative korrelationer repræsenterer en negativ ændring i én variabel på grund af en anden.
  • Et nul korrelativt forhold indikerer, at der ikke er nogen tilsyneladende sammenhæng mellem to eller flere variable.

Når der opstår falske korrelationer, kan forholdet fremstå som enhver form for korrelation, indtil du identificerer falskheden i prøven og bestemmer, hvad der forårsager det.

Årsagssammenhæng

Årsagssammenhænge er i bund og grund årsag-virkningsforhold. Det betyder, at en eller flere variabler direkte påvirker andre variabler for at forårsage et resultat. Et glimrende eksempel på en årsagssammenhæng er en synkende båd. Hvis en båd har et hul, forårsager hullet en lækage, og lækagen får båden til at fyldes med vand og til sidst synke den. Variablerne på spil i dette eksempel inkluderer båden, hullet og vandet.

Hullet i båden påvirker direkte stigningen i vand, der lækker ind i den, hvilket forårsager en negativ ændring i bådens opdrift. Dette årsag-og-virkning-forhold er et simpelt eksempel, men det er vigtigt at forstå, at du kan tilskrive årsagssammenhænge til en faktor, der direkte påvirker en variabel. Korrelative forhold knytter kun to eller flere variable sammen, hvilket danner en mulig forbindelse.

Relateret: Sådan beregnes korrelation i 7 trin

Hvad fortæller falske sammenhænge dig?

En falsk korrelation kan fortælle dig om forholdet mellem forskellige data i en prøve. Når statistikere analyserer prøver for at teste teorier og hypoteser, leder de efter årsag-og-virkning-forhold mellem de variable, de tester. Hvis der dannes falske korrelationer, kan statistikere vurdere, om forholdet mellem to eller flere variable er tilfældigt eller et resultat af en tredje, forvirrende faktor.

Relateret: Typer af diagrammer og grafer

Hvordan man identificerer en falsk sammenhæng

Professionelle, der analyserer data i deres karriere, søger løbende efter sammenhænge mellem variabler i deres studier. Dette betyder at anvende forskellige tilgange til at opdage og redegøre for falske korrelationer. Adskillige metoder, statistikere, dataanalytikere og andre forskere bruger til at finde falske sammenhænge, ​​omfatter:

1. Sikring af passende stikprøvestørrelser

Fagfolk, der arbejder med data, skal sikre, at de får tilstrækkelige stikprøvestørrelser. Hvis en stikprøvestørrelse er for lille, er der større sandsynlighed for, at den har falske korrelationer, fordi der simpelthen ikke er nok data til at danne et større billede af prøvernes adfærd. Denne type scenarier kan skabe tilsyneladende relaterede hændelser, når dataene i en større prøve kan opføre sig anderledes.

2. Vurdering af data for vilkårlige endepunkter

I nogle typer undersøgelser, såsom medicinske eller farmaceutiske undersøgelser, fortæller endepunkter, om testede resultater er gavnlige. Vilkårlige endepunkter er resultater eller resultater, der ikke ser ud til at have nogen årsag eller på anden måde ikke er relateret til variablernes adfærd i undersøgelsen. Hvis disse scenarier opstår, er det sandsynligvis en falsk sammenhæng.

3. Kontrol for eksterne variabler

Når statistikere udvikler undersøgelser, forsøg eller andre eksperimenter, tager de højde for alle faktorer, der kan påvirke variablerne i stikprøvesættet. Når en statistiker analyserer data, evaluerer de disse faktorer for at få en idé om, hvordan de påvirker dataene. At forstå, hvordan udefrakommende faktorer påvirker de data, de studerer, kan hjælpe statistikere med at afgøre, om forhold mellem variables adfærd er levedygtige korrelationer eller falske korrelationer.

Disse tre tilgange kan hjælpe statistikere, dataforskere og andre analytikere med at identificere falske sammenhænge for at analysere det sande forhold mellem variabler.

Relateret: Sådan beregnes korrelationskoefficienten

Eksempler på en falsk sammenhæng

Falske sammenhænge kan være ret almindelige uden for strenge statistiske undersøgelser. Nogle falske korrelationer kan dog forekomme kontinuerligt og med et højt niveau af nøjagtighed, selvom begivenhederne eller prøverne ikke er relaterede. Her er flere eksempler på falske sammenhænge vedrørende hverdagsbegivenheder:

Eksempel 1

Antag, at et diagram viser den opadgående tendens i salg af virtual reality-spil og en stigning i antallet af studerende, der dimitterer med en mastergrad i teknologi i løbet af et specifikt år. Du kan antage, at på grund af studerendes interesse og engagement i VR-teknologien, afsluttede flere personer deres teknologiuddannelser.

Dette bliver dog en falsk sammenhæng, hvis brugerne af VR-spillene er gymnasieelever i løbet af det samme år, som antallet af tech-kandidater stiger. Den ydre faktor af alder ophæver forholdet, fordi elever, der stadig er i gymnasiet, sandsynligvis ikke vil opgradere med en kandidatgrad samtidigt.

Eksempel 2

Et andet eksempel på en falsk sammenhæng er en sammenhæng mellem stigninger i antallet af billetsalg til forlystelsesparker og i antallet af issalg i supermarkeder. Selvom begge salgstal er stigende, er det højst usandsynligt, at stigningen i salget af supermarkedis forårsager stigningen i salget af forlystelsesparker. Ligeledes er det usandsynligt, at stigningen i billetsalg til forlystelsesparker skyldes højere issalg. I dette scenarie er der en tredje forvirrende faktor.

Hvis denne undersøgelse finder sted i løbet af sommeren, er det sandsynligt, at årsagen til begge salgsstigninger er varmen. Højere temperaturer om sommeren kan højst sandsynligt være årsag til, at flere mennesker køber billetter til forlystelsesparker sammen med kolde lækkerier som is i deres supermarkeder.

Frans Bisgaard
Frans Bisgaard Falske sammenhænge kan forekomme i statistik, når to eller flere variabler ser ud til at have en årsag-virkning-sammenhæng med hinanden. Disse typer korrelationer har dog sjældent en sand årsagssammenhæng, selvom de ser ud til at have det. Derudover kan falske korrelationer give dig en bedre forståelse af et datasæts karakteristika og adfærd. I denne artikel vil vi undersøge, hvad falsk korrelation er, hvordan den relaterer til årsagssammenhæng, og hvordan man identificerer en falsk korrelation med nogle eksempler for yderligere indsigt i denne statistiske sammenhæng.