Tölfræði er undirgrein stærðfræðinnar sem fjallar um söfnun, greiningu, túlkun, framsetningu og úrvinnslu á gögnum. Þegar tölfræði er beitt til að leysa vísindalegt, verkfræðilegt eða félagslegt úrlausnarefni er venja að byrja á því að skilgreina þýði eða gera tölfræðilíkan. Þýði getur verið safn fólks eða hluta, eins og „allir íbúar í tilteknu landi“ eða „allar frumeindir í kristal“. Tölfræði fæst við allar hliðar gagna, meðal annars gagnasöfnun með könnunum og tilraunum. Tölfræði er þverfaglegt hjálpartæki í rannsóknum í vísindagreinum sem byggjast á megindlegum aðferðum hvort sem um er að ræða raunvísindi, hugvísindi eða félagsvísindi.

Normalkúrfan er mikilvægt tæki ályktunartölfræðinnar.

Þar sem manntalsgögn eru ekki til safna tölfræðingar gögnum með því að gera rannsókn á úrtaki. Með dæmigerðu úrtaki er hægt að tryggja að ályktanir og niðurstöður eigi við um allt þýðið. Inngripsrannsókn felst í því að mæla tiltekið kerfi sem er til rannsóknar, gera breytingar á því og mæla það aftur með sömu aðferðum til að athuga hvort breytingarnar höfðu áhrif á niðurstöður mælinganna. Áhorfsrannsókn fer hins vegar fram án þess að gerðar séu breytingar á viðfangi rannsóknarinnar.

Hægt er að skipta tölfræði mjög gróflega í tvennt: lýsandi tölfræði og ályktunartölfræði. Lýsandi tölfræði er notuð til að lýsa eiginleikum tölulegra gagna, svo sem miðsækni og dreifingu þeirra. Ályktunartölfræði er hins vegar notuð til að draga ályktanir um tiltekin gögn, svo sem varðar ákveðna eiginleika sem þýði hefur, út frá upplýsingum sem fengust í úrtakinu. Þær breytur sem mældar eru skiptast í nafnkvarða, raðkvarða, jafnbilakvarða eða hlutfallskvarða.

Eitt af fyrstu dæmum þess að tölfræði hafi verið beitt er að finna í verkinu Observations on the Bills of Mortality eftir einn að brautryðjendum lýðfræðinnar, Bretanum John Graunt, sem kom út árið 1662. Ein helst ástæða þróunar í tölfræði var nauðsyn ríkisins á áreiðanlegum gögnum til þess að geta gert áætlanir fram í tímann.[1] Hvað mestur framgangur varð í notkun tölfræði á 19. öld og jókst hún jafnt og þétt í framhaldinu.

Hefð er fyrir því að tölfræði sé talinn aðskilin grein hagnýtrar stærðfræði frekar en undirgrein stærðfræði. Grundvöllur tölfræðinnar var lagður þegar Blaise Pascal og Pierre de Fermat settu fram kenningar sínar um líkindafræði á 17. öld. Carl Friedrich Gauss bætti svo við þekkingu undir lok 18. aldar. Tilkoma nútímalegra tölva með meiri reiknigetu en áður hefur orðið til þess að flókinn tölfræðilegur útreikningur er mun auðveldari en áður.

Dreifð

breyta
Einkunnir nemenda í bekk
Einkunn 1 2 3 4 5 6 7 8 9 10 Alls
Tíðni 0 0 0 3 5 4 8 2 3 0 25
Hlutfall 0 0 0 12% 20% 16% 32% 8% 12% 0 100%
Samanlagt hlutfall 0 0 0 12% 32% 48% 80% 88% 100% 0 100%
Bilskipt tafla 0 3 9 10 3 25

Framsetning á gögnum getur verið margskonar. Sé um einföld töluleg gögn að ræða er hægt að búa til tíðnitöflu sem sýnir tíðni breytanna. Í þessu dæmi einkunna sem nemendur hafa hlotið eru einkunnirnar raðaðar eftir stíganda, þ.e.a.s. þær fara hækkandi. Í fljótu bragði má sjá að fjórir nemendur hafa hlotið einkunnina 6. Hægt er að sjá fjölda nemenda með því að leggja tölurnar saman  .

Samanlögð tíðni er mæld í prósentum og venjulega sett í sér dálk við hliðinni á hlutfallstíðninni. Hún virkar þannig að hlutfallstíðnin í prósentum er lögð saman við samanlögðu tíðinni í færslunni fyrir ofan. Hún hækkar því neðar á töflunna er litið og er ávallt 100% undir lokin.

Bilskipt tafla er framsett með þeim hætti að flokkar eru sameinaðir, sem getur verið þægilegt ef fjöldi mismunandi atriða er mikill eða óskað er eftir gögnum yfir eitthvað sem spannar stórt bil. Dæmi um þetta eru t.d. einkunnir tugi nemenda sem tóku ákveðið próf og síðan raðað eftir einkunnum. Þegar bil eru ákvörðuð er skýrast að hafa þau jafn löng en lengdin sem það spannar er kölluð billengd. Í billengd er tekið til greina alla lengdina sem tölubilið spannar, einnig þegar námundun er notuð. Sem dæmi má nefna bilin 0-4, 5-9 og 10-14 en billengdin í þessu tilviki er 5. Fyrstgreinda bilið spannar tölurnar -0,5 til 4,5, það næsta er 4,5 til 9,5 og það síðastgreinda 9,5 til 14,5. Í dæminu hér til hliðar eru fimm 2 billengdar bil.

Miðsækni

breyta

Miðsækni, meðaltal, miðgildi og tíðasta gildi, í lýsandi tölfræði veitir upplýsingar um dreifingu gagna.

Einkunnir nemenda í bekk
Gildi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Alls
Miðgildi 4 4 4 5 5 5 5 5 6 6 6 6 7 7 7 7 7 7 7 7 8 8 9 9 9 160

Miðgildi er gildi þess staks sem er í miðjunni. Til að reikna út miðgildi skal raða tölunum í beina línu í vaxandi röð, talan sem er í miðjunni er síðan miðgildið eða ef það eru tvær tölur í miðjunni, þá skal taka meðaltal af þeim. Hér til hliðar, í sama dæmi og að ofan, eru 25 tölur og því er tekið meðaltalið af tólftu og þrettándu tölunni.  

Til þess að fá meðaltal eru öll stökin lögð saman og síðan deilt með fjölda þeirra. Vandinn við þetta er að ekki er gert ráð fyrir s.k. útlaga, gildi sem eru óregluleg eða óvenjuleg. Þau gildi geta skekkt upplýsingar tökum dæmi af teningi sem er kastað þrisvar sinnum, upp koma tölurnar:

  1. 3, 3 og 3. Sem er ólíklegt en gefur meðaltalið 3.  
  2. 1, 3, og 5. Sem gefur einnig meðaltalið 3.  

Í dæminu sem við notumst við má gjörla komast að því að meðaltalið er:  

Tíðasta gildi er, eins og nafnið gefur til kynna, sú breyta sem birtist oftast. Vert er að athuga að tíðasta gildið getur verið fleiri en eitt. Í dæminu hér að ofan er það 7 sem kemur 8 sinnum fyrir.

Dreifing

breyta

Til þess að rýna betur í það mengi sem verið er vinna með er hægt að skoða dreifinguna. Spönnin er fundin út með því að draga lægstu töluna frá þeirri efstu. Í dæminu hér að ofan er spönnin  .

Einkunnir nemenda í bekk
Gildi 1-3 4-8 9-12 13-20 21-22 23-25 Meðalfrávik
Frávik 2,4 1,4 0,4 0,6 1,6 2,6 1,24

Meðalfrávik er mælikvarði á meðalfjarlægðinni frá meðaltalinu. Til að fá út meðalfrávik er fyrst fundið út meðaltalið, það dregið frá sérhverri tölu til að fá frávik hverrar tölu frá meðaltalinu, frávikin eru öll lögð saman án tillits til formerkja (mínus breytist í plús) til að fá heildarfrávik og á endanum er heildarfrávikið deilt með fjölda talna.  

Formúla staðalfráviks
  Þar sem:   = samanlagður fjöldi talna.

  = Tölur settar í annað veldi, síðan lagðar saman.

  = Allar tölurnar lagðar saman og útkoman sett í annað veldi.

Staðalfrávik er önnur aðferð til að finna út dreifingu talna í líkindadreifingu, handahófskenndri breytu, þýði eða gagnasafni. Lástafur gríska bókstafsins sigma σ er oftast notaður til þess að tákna staðalfrávik (eða s í latneska stafrófinu). Staðalfrávik slembibreyti, þýðis, gagnasetts eða dreifingar er skilgreint sem kvaðratrótin af dreifni þess.

Frávikshlutfall

breyta

Frávikshlutfall er formúla sem er notuð til að bera staðalfrávik mismunandi talnahópa saman. Formúlan reiknar út hlutfall staðalfráviksins af meðaltalinu.

Formúlan er eftirfarandi:

Frávikshlutfall =  

  = Staðalfrávik

  = Meðaltal allra talnanna

Tengt efni

breyta

Tilvísanir

breyta
  1. Samanber forskeytið „stat“ á orðinu yfir tölfræði í ensku, þýsku, dönsku og fleiri tungumálum.


Tenglar

breyta