ⓘ Free online encyclopedia. Did you know? page 245

Andmete visualiseerimine

Andmete visualiseerimine on infoühiskonna kommunikatsioonipraktikate komponent, mis keskendub statistiliste või muude lähteandmete arusaadavaks tegemisele nende oluliste aspektide visuaalse kujutamise abil nägemistaju iseomast võimekust ära kasut ...

Anscombei kvartett

Anscombei kvartett on statistikas hoiatav näide sellest, kuidas neli statistiliste omaduste poolest identset andmehulka näivad graafiliselt kujutatuna erinevad. Näite tõi 1973. aastal statistik Francis Anscombe, et demonstreerida andmete visuaals ...

Aposterioorne tõenäosus

Aposterioorne tõenäosus on Bayesi statistikas sündmuse A tõenäosus pärast katse sooritamist, kui on teada, et selle katse tulemusena toimus teatav teine sündmus B. Aposterioorset tõenäosust tähistatakse nii: P A | B {\displaystyle PA|B}

Asümmeetriakordaja

Asümmeetriakordaja on tõenäosusteoorias ja statistikas arvuline parameeter, mis näitab tunnuse jaotuse lähedusastet sümmeetrilisele jaotusele. Asümmeetriakordaja võib olla positiivne või negatiivne või defineerimata. Sümmeetrilise jaotuse korral ...

Bayesi teoreem

Tõenäosusteoorias ja statistikas kirjeldab Bayesi teoreem sündmuse toimumise tõenäosust eeldusel, et sündmus on kuidagi seotud eelnevalt toimunud sündmustega – Bayesi teoreem arvutab tingimusliku tõenäosuse. Bayesi teoreem on saanud nime matemaat ...

Binoomjaotus

Binoomjaotus on tõenäosusteoorias ja statistikas juhusliku suuruse X diskreetne jaotus, mis kirjeldab n ühesuguse ja sõltumatu järjestikuse katse korral sündmuse A toimumist, kui iga katse tulemus võib olla kas jah või ei ning jah tulemuse saamis ...

Bootstrap (statistika)

Bootstrap - meetod on arvutusmahukas statistiline meetod, mis põhineb taasvalikul. Bootstrapi abil saab hinnata mingit üldkogumi parameetrit või leida selle usaldusvahemikku. See meetod võimaldab hinnata peaaegu kõikide statistiliste parameetrite ...

Cronbachi α

Cronbachi α on statistikas sisereliaabluse koefitsient. Tihti kasutatakse seda psühhomeetrilistes testides osalenute valimi reliaabluse hindamiseks. Esmakordselt nimetas selle alfaks Lee Cronbach 1951. aastal. Seda mõõdikut võib vaadata ka laiend ...

Diagramm

Diagramm ehk arvjoonis on andmete esitamise graafiline viis, mis aitab andmeid paremini analüüsida ja nähtuste olemusest kergesti aru saada. Arvväärtusi ning nende seoseid kujutatakse graafiliselt – geomeetriliste kujundite süsteemina. Diagrammid ...

Dispersioonanalüüs

Dispersioonanalüüs ehk ANOVA on kogum statistilisi meetodeid rühmade keskmiste võrdlemiseks. Need on andmeanalüütilised ja struktuuri kontrollivad statistilised meetodid, millel on palju erinevaid rakendusi. Neile on ühine, et nad arvutavad dispe ...

Ekstsess

Jaotuse ekstsess ehk järsakuskordaja on statistikas arv, mis iseloomustab juhusliku suuruse X jaotuse kuju võrreldes seda sama aritmeetilise keskmise ja standardhälbega normaaljaotusega.

Hajuvusdiagramm

Hajuvusdiagramm ehk korrelatsiooniväli on kahe tunnuse ühisjaotuse graafiline esitus. Teisiti öeldes: korrelatsiooniväli on koordinaattasandile kantud punktide hulk, kus punkti esimeseks koordinaadiks on objekti esimese tunnuse väärtus ja teiseks ...

Histogramm

Histogramm ehk astmikdiagramm on statistiliste andmete graafiline kujutis, mis annab ülevaate nende jaotumisest sageduse järgi. Andmete tunnuse väärtused on enamasti kujutatud rõhtteljel ja andmete sagedused püstteljel.

Hot-Deck imputeerimismeetod

Hot-Deck imputeerimismeetod on üks doonoripõhistest imputeerimismeetoditest. See tähendab, et imputeeritakse reaalselt eksisteeriv väärtus, mis on saadud mõne teise objekti puhul. Antud imputeerimismeetodi puhul on garanteeritud see, et saadud vä ...

I ja II tüüpi viga

I tüüpi viga tehakse siis, kui lükatakse tagasi õige nullhüpotees. Uurimustulemustes leitakse erinevus, kuigi seda tegelikult ei eksisteeri. II tüüpi viga tehakse siis, kui võetakse vastu nullhüpotees, aga tegelikult kehtib alternatiivne hüpotees ...

Imputeerimine

Imputeerimine on statistikas puuduvate andmete kohtade täitmine sobivate asendusväärtustega. Osaliselt puuduvad andmed võivad tekitada probleeme andmete analüüsimisel. Puuduvad andmed asendatakse hinnangutega, mis põhinevad teistel allikatel.

Interaktsioon (statistika)

Interaktsioon ehk koosmõju on andmeanalüüsis olukord, kus ühe muutuja mõju funktsioontunnusele muutub sõltuvalt mingi kolmanda tunnuse väärtusest. Sellisel juhul öeldakse, et esineb interaktsioon või koosmõju argumenttunnuste vahel. Näiteks: uuri ...

Isokvant

Isokvant tähendab majandusuuringutes kõverat, mis kajastab erinevate tegurite kombinatsioone. Selle edasiarendus – isokvantanalüüs – on vaatlusandmete statistilise töötlemise meetod, mis sisaldab dispersioon-, regessioon- ja klasteranalüüsi elemente.

Jaotus (matemaatika)

Jaotus ehk jaotusseadus ehk tõenäosusjaotus on eeskiri, mis seab juhusliku suuruse iga väärtusega x i vastavusse selle väärtuse omandamise tõenäosuse P. Jaotust saab esitada tabelina, graafiliselt, tõenäosus- või jaotusfunktsioonina. Matemaatilis ...

Jaotusfunktsioon

Jaotusfunktsioon või kumulatiivne jaotus on tõenäosusteoorias pideva juhusliku suuruse jaotuse iseloomustaja. Juhusliku suuruse X jaotusfunktsioon F {\displaystyle F} näitab iga arvu x kohta tõenäosust, et juhuslik suurus X on sellest arvust väik ...

Kaalutud keskmine

Kaalutud keskmine on kaaludega varustatud suuruste keskmine, mis leitakse valemist a ¯ = ∑ i = 1 n b i ⋅ a i p ∑ i = 1 n b i 1 p = b 1 ⋅ a 1 p + ⋯ + b n ⋅ a n p b 1 + ⋯ + b n 1 p, {\displaystyle {\bar {a}}=\left{\frac {\sum _{i=1}^{n}b_{i}\cdot a ...

Kahe valimi t-test

Kahe valimi t -test on üks statistiline test, üks t -testidest. See kontrollib kahe valimi keskmiste järgi, kas kahe üldkogumi keskmised on omavahel võrdsed. Kahe valimi t -testil on kaks varianti: kahe mittesõltumatu valimi jaoks. kahe sõltumatu ...

Keskväärtus

Keskväärtus on mõõdetavate suuruste ja nende realiseerumise tõenäosuste korrutiste summa. Näiteks pikas katseseerias, kus ühte katset korratakse samadel tingimustel, tulemuste keskmine sarnaneb üha rohkem tulemuste keskväärtusega. Keskväärtus ei ...

Kolme sigma reegel

Kolme sigma reegel on rakendustes kasutatav tunnuse hajuvuspiiride hindamise eeskiri, mis ütleb, et normaaljaotusega juhusliku suuruse väärtustest kuulub 99.74% lõiku, sõltumata keskväärtuse x ¯ {\displaystyle {\bar {x}}} ja standardhälbe σ {\dis ...

Kumulatiivne sagedus

Kumulatiivne sagedus on statistika mõiste. Kumulatiivse sageduse puhul absoluutsed sagedused liidetakse kuni käsiloleva väärtuse sageduseni, kasutatakse ka kumulatiivset suhtelist sagedust.

Kvalitatiivne tunnus

Kvalitatiivne tunnus ehk mittearvuline tunnus on tunnus, mille väärtusi ei saa väljendada otseselt arvudena. Kvalitatiivsele tunnusele vastandub kvantitatiivne tunnus. Kvalitatiivne tunnus on nt inimeste juuste värvus.

Kvantitatiivne tunnus

Kvantitatiivne tunnus ehk arvuline tunnus ehk arvtunnus on tunnus, mille väärtused avalduvad otseselt arvudena. Kvantitatiivsele tunnusele vastandub kvalitatiivne tunnus. Kvantitatiivne tunnus on nt inimeste hammaste arv.

Kvartiil

Kvartiil id on kirjeldavas statistikas tunnuse väärtused variatsioonireal, mis jagavad variatsioonirea neljaks ligikaudu võrdseks osaks. Ülemine kvartiil e. 3. kvartiil e 75-protsentiil ehk 0.75 kvantiil lühendid UQ ja Q 3 on tunnuse väärtus, mil ...

Lihtne juhuslik valik

Lihtne juhuslik valik on selline valikuprotseduur, kus kõik n {\displaystyle n} -mahulised valimid N {\displaystyle N} -mahulisest üldkogumist on võrdtõenäosed. Eristatakse kahte liiki lihtsat juhuslikku valikut: tagasipanekuta ja tagasipanekuga ...

Lineaarregressioon

Lineaarregressioon on statistiline meetod, mille abil saab lähendada muutujate vahelisi seoseid. Lineaarregressiooni kasutatakse näiteks masinõppes. Selle tarbeks leitakse sobiv lineaarfunktsioon, mis vaadeldud andmete vahelist seost piisaval mää ...

Logistiline regressioon

Logistiline regressioon või üldisemalt logistiline mudel ehk logit -mudel on üks üldistatud lineaarsetest mudelitest, mis prognoosib uuritava sündmuse toimumise tõenäosust ja selle muutumist sõltuvalt pideva argumenttunnuse väärtuse muutumisest. ...

Matemaatiline statistika

Matemaatiline statistika on matemaatika haru, mis käsitleb statistiliste andmete põhjal järelduste tegemist üldkogumi kohta. Matemaatilise statistika teoreetiline alus on tõenäosusteooria.

Mediaan

Mediaan on variatsioonirea keskmise liikme väärtus. Näiteks variatsioonirea {3, 3, 5, 9, 11} mediaan on 5. Kui reas on paarisarv liikmeid, loetakse mediaaniks tavaliselt kahe keskmise liikme aritmeetiline keskmine, näiteks {3, 5, 7, 9} mediaan on ...

Metaanalüüs

Metaanalüüs on uuringu liik, mille materjalidena kasutatakse paljude uurimistööde tulemuste sünteesi ja tõlgendamist ning nende põhjal üldistuste tegemist. Metaanalüüsi kasutatakse paljudes teadusharudes.

Mitteparameetriline statistika

Mitteparameetriline statistika ehk jaotusvaba statistika on matemaatilise statistika valdkond, kus ei eeldata, et uuritavatel tunnustel on normaaljaotus vm teadaolevat tüüpi jaotus. Mitteparameetrilise statistika peamõisteid on Spearmani korrelat ...

Mood (statistika)

Mood on statistikas tunnuse kõige sagedamini esinev väärtus. Kui kõik tunnuse väärtused on võrdsed, siis mood puudub. Kui tunnusel on üks mood, siis on tunnus unimodaalne. Kui moode on mitu, siis on tunnus bimodaalne.

Multinomiaalne logistiline regressioon

Multinomiaalne logistiline regressioon on klassifitseerimismeetod enam kui kahe võimaliku diskreetse tulemuse jaoks. See on binaarse logistilise regressiooni üldistus, kus olemasolevate andmete põhjal luuakse mudel selleks, et hinnata erinevatess ...

Normaaljaotus

Normaaljaotuseks nimetatakse matemaatikas pideva juhusliku suuruse X jaotust, mida iseloomustab tihedusfunktsioon f x = 1 σ 2 π e − 1 2 x − μ σ 2 {\displaystyle fx={\frac {1}{\sigma {\sqrt {2\pi }}}}e^{-{\frac {1}{2}}\left{\frac {x-\mu }{\sigma } ...

Nullhüpotees

Nullhüpotees on statistilise hüpoteesi osa, mille kohaselt püstitatud oletus ei kehti. See eeldab, et mõõdetud nähtuste vahel ei ole seost. Nullhüpoteesi tähistatakse tihti H 0 {\displaystyle \mathrm {H_{0}} }, ning nullhüpoteesi välistavat hüpot ...

Olulisuse tõenäosus

Olulisuse tõenäosus on väikseim olulisuse nivoo, mis antud valimi põhjal lubab vastu võtta alternatiivse hüpoteesi. See näitab antud valimi sobivust nullhüpoteesiga.

Paralleelkoordinaadid

Paralleelkoordinaadid on vahend visualiseerida mitmemõõtmelist ehk n -dimensionaalset geomeetriat ning analüüsida mitmemöötmelisi andmeid. Et näidata punkti mitmemõõtmelises ruumis, joonistatakse joonise taustale võrdsete vahedega n paralleelset, ...

Peakomponentide analüüs

Peakomponentide analüüs ehk peakomponentide meetod on matemaatiline meetod, mis võimaldab suurest hulgast andmetest saada võimalikult tõene vajalik informatsioon kasutades vaid mittekorreleeruvaid peakomponentide andmeid. Peakomponentide abil saa ...

Poissoni jaotus

Poissoni jaotus on tõenäosusteoorias ja statistikas diskreetne jaotus, mis kirjeldab määratud arvu sündmuste toimumise tõenäosust määratud ajavahemikus või ruumipiirkonnas, kui antud sündmused toimuvad teada oleva vahega ja sõltumatult eelmise sü ...

Polünomiaalne regressioon

Polünomiaalne regressioon on statistikas regressioonanalüüsi meetod, kus sõltumatu muutuja x ning sõltuva muutuja y seos avaldatakse kui kaalutud summa x üheliikmelistest polünoomidest. Kuigi polünomiaalne regressioon võimaldab muutujate x ja y v ...

Protsent

Protsent on ühik, mis väljendab arvulist suhet üks sajandikosa tervikust. Protsendi tähis ehk märk on %. 1 % = 1 00 = 0, 01 = 10 − 2. {\displaystyle 1\,\%={\frac {1}{1{\,}00}}=0{,}01=10^{-2}.} Protsentidega esitatakse suhtelist suurust sajandikos ...

Regressioonanalüüs

Regressioonanalüüs meetodite kogum statistikas, kus uuritakse suuruste vahelist sõltuvust ja võimalusi sõltuvuse funktsionaalseks kirjeldamiseks etteantud valemi põhjal. Regressioonanalüüsi käigus leitakse regressioonmudeli deterministlik kompone ...

Ruutkeskmine

Mingite arvude ruutkeskmine on ruutjuur nende arvude ruutude aritmeetilisest keskmisest. Elektrotehnikas kasutatakse vahelduvvoolu tugevuse ruutkeskväärtuse kohta mõistet efektiivväärtus.

Sagedustabel

Sagedustabel - võtab andmetabelist kokku mitmel objektil mingit väärtust esineb ehk esitab vastava sageduse. Peame teadma milliseid väärtusi tunnus võib omandada ja kui sageli iga väärtus esines.mitmel üliõpilasel on hallid silmad.

Standardhälve

On kasutada järgmised väärtused: 2, 4, 4, 4, 5, 5, 7, 9 {\displaystyle 2,\;4,\;4,\;4,\;5,\;5,\;7,\;9} Nende kaheksa väärtuse aritmeetiline keskmine on 5: 2 + 4 + 4 + 4 + 5 + 5 + 7 + 9 8 = 5. {\displaystyle {\frac {2+4+4+4+5+5+7+9}{8}}=5.} Et arvu ...

Standardviga

Standardviga on hinnang kui sarnane on vaadeldava valimi keskmine oletatavale populatsiooni keskmisele, samas kui standardhälve näitab kuivõrd valimis olevad üksikväärtused erinevad valimi keskmisest. Seega sõltub standardviga valimi suurusest, k ...