Babes Bolyai Tudományegyetem 2009 távoktatás
Kísérleti pszichológia és általános statisztika
A próbafüggvények és típusai
feb 11th
Statisztika, 16. tétel, pszichológia távoktatás
A próbafüggvények és típusai
(leírás, magyarázat)
Berei Kati által kidolgozva
Próbafüggvény
- A hipotézisek vizsgálatára hasznájunk
- mintáról mintára ingadozó jellemzők (vagyis a sokaságból vett minták megfelelő értékei nem véletlenszerűen, hanem függvényszerűen változnak)
- A próbafüggvényt úgy kell megválasztani, hogy
- a sokaságra tett bizonyos kikötések teljesüljenek
- a mintavétel adott módja és nagysága szerint
- feltételezzük a H0 helyességét
- ismert kell legyen a függvény valószínűségeloszlása: ehhez a H0 egyszerű hipotézis kell legyen.
Próbák lehetnek:
- egymintás próbák – olyan próbák, melyek elvégzéséhez elégséges egyetlen minta
- egymástól független minták vagy ún. páros minták lehetnek – amikor két vagy több minta szükséges, melyekről feltételezzük fel, hogy különböző sokaságokból származnak.
A HIPOTÉZISVIZSGÁLAT SORÁN HASZNÁLT PRÓBAFÜGGVÉNYEK
- Standard normális eloszlás
- a sokaságok egy jó része normális eloszlású – ezek próbafüggvényeit általában a standard (normális) eloszlás sűrűségfüggvényével írhatjuk le (ennek jellegzetes értékei táblázatban vannak, nincs szabad paraméter)
A leggyakoribb szignifikanciaszintekhez tartozó z-értékek:
| szignifikanciaszint α
% |
0,10
10% |
0,05
5% |
0,01
1% |
|
| egyoldali próba | jobb oldali | -1,28 | -1,6545 | -2,33 |
| baloldali | 1,28 | 1,6545 | 2,33 | |
| kétoldali próba | ± 1,6545 | ± 1,96 | ± 2,58 | |
Azért, hogy ne kelljen állandóan behelyettesítgetni a normál eloszlás sűrűségfüggvényébe az értékeket – standardizálták, vagyis megfosztották a mértékegységtől:
z – standard érték
x – függő változó
μ – átlag
σ – szórás
- a standard z érték egy egységnyi szórásnak felel meg
- a várt érték 0,
- egy adott z értékhez tartozó görbe alatti területek értékét táblázatba foglalták – ezeket megkapjuk vizsgán (ez a 3-as táblázat minden statisztikakönyv végén)
Standardizálás 1 példa
Egy diákcsoport IQ-átlaga 110, szórása pedig 15 pont volt. Határozza meg a 125, illetve a 90 pontú hallgató standard eredményét, s helyzetét!
50+34,13% Nálánál gyengébb vagy azonos eredményt 84,13% ért el.
-40,8 ~ 9% nálánál is gyengébb eredményt produkált.
Standardizálás 2 példa.
Egy diákcsoport tesztátlaga 50, szórása pedig 20 pont volt. Határozza meg a 70, illetve a 45 pontú hallgató standard eredményét, s helyzetét!
50+34,13% Nálánál gyengébb vagy azonos eredményt 84,13% ért el.
-9,87%~ 40% nálánál is gyengébb eredményt produkált.
- Student féle t-eloszlás (sörgyári „megvilágosodás” ☺)
- egy normális és egy c négyzet eloszlású változó transzformáltjának hányadosából származtatható
- szimmetrikus a 0 pontra, a t-eloszlást egy paramétere, szabadságfok (ν) jellemzi.
- A szabadságfok növekedésével, vagy nagy minták esetén (n >100) a t-eloszlás egyre közelít a standard normális eloszláshoz.
- A Student-féle t-eloszlás táblázata a szabadságfok függvényében és a választott szignifikanciaszint szerint adja meg az elutasítási tartomány határát (értékeit megadják táblázatban vizsgán (a III. mellékletben vannak))
- Khi-négyzet eloszlás (más néven függetlenség ellenörzés)
- a khi-négyzet eloszlás paramétere a szabadságfok
- a görbe alatti területek egyaránt 1-gyel egyenlők, illetve a szabadságfok növekedésével az eloszlás mind jobban kezd hasonlítani a normális eloszláshoz
- megadják táblázatban (IV melléklet) az eloszlás percentiliseit a szabadságfok függvényében.
- ha a szabadságfok nagyobb mint 50, akkor a normális eloszlás táblázata is használható. (itt a tábla mérete a meghatározó!)
-
A c2 kétoldali 5%-os konfidenciahatárai tehát:
- Fisher féle F-eloszlás
- A kétmintás próbák elemzésekor a két minta átlagainak különbsége mellett fontos a két minta varianciájának a vizsgálata is
- Ha a sokaság (közel) normális eloszlású, akkor a belőle vett két-két minták varianciájának a hányadosa egy bonyolult újabb eloszlást eredményez.
- Az V. Melléklet mutatja az F-eloszlás leggyakrabban használt, 95-ödik percentilis értékeit a minták szabadságfokának függvényében.
Meghatározás:
, ahol
a korrigált szórás, N a minták korrigált szórása
-
Amennyiben az F-eloszlást a statisztikai próbáknál a populációk varianciájának összehasonlítására kívánjuk felhasználni, az a nullhipotézisünk, hogy a két variancia megegyezik, azaz:
ilyenkor az F-eloszlás képlete tovább egyszerűsödik:
A tört képzésekor rendszeresen a nagyobb empirikus szórásnégyzetet jelöljük s12-el és azt osztjuk el az alacsonyabb értékű s22-vel.
A szabadságfok
- Mind a t-, mind a c -négyzet kiszámításához a mintából kapott és bizonyos sokasági paraméterek szükségesek
- szabadságfok (nű) kiszámításához: a mintanagyságból (N) levonjuk a mintából becsülni kívánt paraméterek (k) számát: ν = N–k.
- A t-statisztika esetében az N számú elemből kiszámíthatjuk a mintaátlagot és -szórást.
- c négyzetnél a mintából számítható annak szórása – a gyakorlatban a kontingenciatábla méretéből származtatjuk az eloszlás szabadságfokát.
(Kicsit sántító, de képszerű példa a szabadságfok fogalmára: 10 vendéget várunk, ezért kikészítünk 10 széket; az elsőként megérkező vendég választhat, melyik székre ül le. Még a kilencediknek érkező vendég is választhat a szabadon levő két szék közül, de a tízedik vendégnek már nincs szabadság(fok)a a szék megválasztásában, hiszen már csak egyetlen egy üres.)
A mellékletekben kévő táblázatok az elektronikus konyvtárban a Statisztika ablak cím alatt vannak!
Megjegyzés: nem minden képet sikerült beszúrni… ![]()
A hipotézisvizsgálatok során elkövethető hibák és a csökkentés lehetőségei
feb 11th
Statisztika, 15. tétel, pszichológia távoktatás
A hipotézisvizsgálatok során elkövethető hibák és a csökkentés lehetőségei
(leírás, magyarázat)
Berei Kati által kidolgozva
- Hipotézisvizsgálat - arra szolgál, hogy mintavétel alapján megvizsgáljuk a sokaságra vonatkozó olyan feltevések helyességét
- Döntési hiba – ha a hipotézisvizsgálat során igaznak fogadunk el egy valóságban nem igaz feltevést vagy elvetünk olyat, ami igaz – ez azért történhet meg, mert nem konkrét értékellel, hanem valószínűségekkel dolgozunk (ha valaminek kicsi a valószínűsége, attól még megtörténhet, s fordítva).
Az elsőfajú hiba
- akkor fordul elő, ha a H0-hipotézist annak ellenére el utasítjuk, hogy az a valóságban helyes
- oka: bár H0 null-hipotézis helyes, de az adott mintából számított próbafüggvény-érték mégis a kritikus tartományba esik.
- Az első fajta hiba nagysága a szignifikanciaszinttel egyenlő.
A másodfajú hiba
- H0-t elfogadjuk, pedig az valójában nem igaz
- oka: H0 nem igaz, és a próbafüggvény mégis az elfogadási tartományba esik
- a hiba elkövetésének valószínűsége β.
☻ Ha a két eloszlás várható értéke közt nagy a különbség, akkor a második fajta hiba egészen kicsi.
☻Ha a két eloszlás közel esik, akkor nagy a második típusú hiba.
☻Túl nagy minta esetén túlságosan kis különbségek is szignifikánssá válnak! (A szórások egyre szűkülnek – megszűnik a 2. típusú hiba)
Próba ereje: β = 1 – α
- annak az eseménynek a valószínűsége, hogy nem követjük el a másodfajú hibát (nem fogadjuk el tévesen a null-hipotézist)
| H0-t | H0 a valóságban | |
| igaz
(H1 nem igaz) |
nem igaz
(H1 igaz) |
|
| elvetjük | elsőfajú hiba
(α) |
helyes döntés
(1-β) |
| nem vetjük el
(elfogadjuk) |
helyes döntés
(1-α) |
másodfajú hiba
(β) |
! Hogyan csökkenthetjük a hibalehetőségeket?
Az elsőfajú hibánál:
- az elkövetési valószínűség α , ennek alkalmas megválasztásával a hiba tetszés szerint korlátozható.
A másodfajú hibánál
- adott szignifikancia-szint és egyszerű alternatív hipotézis esetén a másodfajú hiba elkövetésének valószínűsége a mintanagyság növelésével vagy minél kisebb szórású próbafüggvény használatával mérsékelhető.
Hipotézisvizsgálatok
feb 10th
Statisztika, 14. tétel, pszichológia távoktatás
Hipotézisvizsgálatok
(leírás, magyarázat)
Berei Kati által kidolgozva
- statisztikai döntés – amikor mintákból a sokaságra vonatkozó hipotéziseinket vizsgáljuk, s eldöntjük azok helyességét, vagy helytelenségét
- A sokaságról gyakran nincs elégséges mennyiségű adatunk (a sokaság végtelen – a pszichológiai vizsgálatok egy része ugyan véges sokaságon történik, de túl nagy elemszámmal, ám következtetéseit általánossá, minden emberre vonatkozóvá igyekszik formálni). Ilyenkor ugyancsak mintából kell következtetnünk a sokasággal kapcsolatos sejtésünk, hipotézisünk igazságáról.
Hipotézisvizsgálat:
- arra szolgál, hogy egy (több) sokaságra vonatkozó olyan feltevések helyességét ellenőrizzük egy (több) minta adatai alapján, melyek helyességéről nem vagyunk teljes mértékben meggyőződve.
- eszközei a próbák
- hipotézis – a sokaság állapotára vonatkozó feltételezésünk
- a hipotézisvizsgálat lényege: a minta adataiból kiszámítjuk egy ún. próbafüggvény értékét, és megnézzük hogy az egy előre kijelölt elfogadási tartományba, vagy egy másik tartományba, az ún. kritikus tartományba esik-e. Előbbi esetben elfogadjuk, utóbbiban pedig elvetjük a hipotézist.
A hipotézis megfogalmazása
- a hipotézisvizsgálat legelső lépése.
- a hipotézisünket ún. null-hipotézis formájában fogalmazzuk meg
- egyúttal rögzítjük az azzal szemben álló, ún. alternatív hipotézist (ellenhipotézist).
- Ezek közül azt fogjuk elfogadni, amelyik a mintavétel eredménye alapján nagyobb valószínűséggel rendelkezik.
Hipotézisünk lehet:
- egyszerű - ha fennállásának feltételezése a sokaság eloszlását egyértelműen meghatározottá teszi. Azt fogalmazzuk meg, hogy az ismeretlen sokasági jellemző (Q) megegyezik egy feltételezett értékkel (Q0) Þ H: Q=Q0
- összetett - mindig visszavezethető több egyszerű hipotézisre. Az ellenhipotézis (alternatív hipotézis) általában összetett. Egyenlőtlenséget fogalmazunk meg, azaz tartomány(oka)t jelölünk ki a paraméter valószínű értékére Pl.: H: Q >= Q0 vagy H: Q ¹ Q0
A két hipotézist oly módon kell megfogalmazni, hogy azok:
- egyszerre ne lehessenek igazak;
- akármelyik is a nagyobb valószínűséggel rendelkező, megválaszolható legyen a bennünket érdeklő kérdés.
A null-hipotézis (H0)
- Mindig a null-hipotézis helyességéről, vagy helytelenségéről döntünk
- egyszerű - a kísérleti beavatkozás nem okoz változást, a változás várható értéke 0) – vele szemben: alternatív hipotézis (H1) összetett
- ha a H0 és a H1 kölcsönösen kizárják egymást, akkor a H0 – re vonatkozó döntés közvetetten mindig döntést jelent H1-re vonatkozóan is:
- · a H0 elfogadása egyúttal H1 elvetése
- · H0 elvetése egyben H1 elfogadása
Pl.1. Ha egy gyártó berendezést kívánunk ellenőrizni, hogy az elhasználódás során pontatlanná vált-e, akkor a null-hipotézist úgy fogalmazzuk meg, hogy a berendezés pontosan működik. Ha a mintából végzett próba azt valószínűsíti, hogy igen, akkor elfogadjuk a H0-t, ellenkező esetben elvetjük.
Pl.2. Ha a diákok úgy gondolják, hogy a vizsgatesztek nem egyforma nehézségűek voltak, ennek vizsgálatára szolgáló H0 az lesz, hogy nincs különbség a tesztek nehézsége között, az vizsgapontokban megmutatkozó különbségek csak a véletlennek tulajdoníthatók. Ha annak van nagyobb valószínűsége, hogy az A-teszt nehezebben megoldható, mint a B-teszt, akkor elvetjük a H0-t, s helyébe lép a H1, azaz, hogy a tesztek között eltérés valószínűsíthető.
Szignifikanciaszint
(szignifikáns = jelentéssel bíró) – illik a kísérlet elvégzése előtt rögzíteni!
- az az α -valószínűség, ami már elég kicsi a H0 elvetéséhez
- az a valószínűség:, amely
- a hipotézis megengedő voltát igazolja
- a feltevés helyességét valószínűsíti
- amely értéknél a H0 való eltérés jelentős.
nem szignifikáns szignifikáns különbség
- a szignifikanciaszint általában 5% vagyis akkor vetjük el a null-hipotézist, ha 5%-nál kisebb a valószínűsége annak, hogy a statisztika ilyen értéket vegyen fel, mint a konkrét esetben.
Szignifikáns az eredmény, ha a H0-tól való eltérés jelentős, nem a véletlen (a mintavételi ingadozás) hatására jött létre
- próba megbízhatósági szintje:
- a szignifikanciaszintet 1-re kiegészítő β= 1–α valószínűség
- annak az eseménynek a valószínűsége, hogy nem vetjük el a helyes H0-t
A nem szignifikáns eredmény a véletlen hatására is létrejöhet!
A kritikus tartomány
- a próbafüggvény lehetséges értékeinek tartományát osztópontok segítségével két (egymást át nem fedő) részre bontjuk:
- elfogadási tartomány (E)
- visszautasítási – kritikus – tartomány (K).
- E két tartomány határait úgy választjuk meg, hogy a próbafüggvény a H0 fennállása esetén előre megadott nagy valószínűséggel az elfogadási tartományba essen. Lehet:
– egyoldali (bal, jobb) és
– kétoldali:
K E K E K E K
α 1- α α/2 1- α α/2 1- α α
baloldali kétoldali jobboldali
- Ha minta adataiból számított próbafüggvény α értéke az elfogadási tartományba esik, akkor elfogadjuk H0-t
- ellenkező esetben pedig elvetjük a H0-t, elfogadjuk a H1 alternatív hipotézist.
Az elfogadási tartomány határait mindig úgy jelöljük ki, hogy a próbafüggvény H0 helyességét feltételezve előre meghatározott nagy (1– α) valószínűséggel ebbe essen. A kritikus tartományba esésnek valószínűsége ennek megfelelően α és kicsi.
Az α értéket szignifikanciaszintnek nevezzük.
Összefoglalás – a hipotézisvizsgálat lépései:
1. A H0 null-hipotézis és egy vele szemben álló H1 alternatív hipotézis megfogalmazása.
2. olyan próbafüggvény konstruálása, illetve keresése, amelynek eloszlása H0 helyességét feltételezve és a próba alkalmazási feltételeinek fennállását adottnak véve egyértelműen meghatározható.
3. Egy 0-hoz közeli a szignifikanciaszint választása, és a próbafüggvény lehetséges értéktartományának ezzel és az alternatív hipotézissel összhangban lévő felosztása egy elfogadási és egy visszautasítási (kritikus) tartományra.
4. A mintavétel gyakorlati lebonyolítása, és a próbafüggvény számszerű értékének meghatározása a mintából.
5. Döntés a H0 és H1 hipotézisek helyességéről: ha a próbafüggvény értéke az előre kijelölt elfogadási tartományba esik, elfogadjuk H0-t, ellenkező esetben pedig visszautasítjuk, elvetjük azt. Ezzel együtt az alternatív hipotézis az előbbi esetben elvetésre, az utóbbiban pedig elfogadásra kerül.
A mintavétel szabályai, reprezentatív minta, mintavételi hibák
feb 10th
Statisztika, 12. tétel, pszichológia távoktatás
A mintavétel szabályai, reprezentatív minta, mintavételi hibák
(magyarázat)
Berei Kati által kidolgozva
Reprezentatív minta:
- ha valami oknál fogva nem tudjuk a sokaságot megvizsgálni (elvileg lehetetlen mert végtelen), akkor a sokaságból vett minta alapján tudunk következtetéseket levonni a teljes sokaságra vonatkozóan.
- ezt csak akkor tehetjük meg ha a minta összetételében hasonló a sokaság összetételéhez – a vizsgált szempontból is reprezentálja a sokaságot
- Ha ez igaz, akkor:
- megbecsülhetjük a sokaság egy jellemző értékét
- ellenőrizhetjük a sokaságra vonatkozó hipotézist
A mintavétel szabályai:
- alapelv: a véletlen (valószínűségi) mintavétel – a reprezentatív mintát úgy biztosíthatjuk, ha a populáció minden tagjának ismert, nem-nulla esélyt, egyforma esélyt adunk a mintába kerülésre
- tehát reprezentatív minta = véletlenszerűen kiválasztott minta
- A sokaságból vett egy (néhány) reprezentatív minta értékeiből következtetünk a sokasági jellemzőre.
- Mintavételi hibák:
- még a leggondosabb mintavételi eljárással sem kapunk szinte sohasem az eredeti sokaságot tökéletesen reprezentáló mintát. Bizonyos mértékű mintavételi hiba mindig marad.
- a véletlenségből adódó hiba számszerűsíthető, figyelembe vehető
Standard hiba – a mintavételi eloszlás szórása
Belátható, hogy N növekedésével (vagyis nagyobb minta esetén) a standard hiba csökken.
Korreláció, regresszió
feb 10th
Statisztika, 11. tétel, pszichológia távoktatás
Korreláció, regresszió
Berei Kati által kidolgozva
Korrelációs kapcsolat (kölcsönösség, kölcsönös viszony):
- két mennyiségi (arány és/vagy intervallum) ismérv szerinti kombinatív osztályozás esetén fordul elő
- a kapcsolat monoton jellegű és nem függvényszerű: egyik független változó módosulásával a másik független változó is változik.
Korrelációs kapcsolat típusai:
- nincs kapcsolat az ismérvek között, ha az egyik X -hez bármekkora Y tartozhat.
- lineáris kapcsolat – ha X növekedésével Y is közel azonos arányban nő (csökken)
- monoton vagy Spearman-féle korreláció – ha X változását Y valamilyen, többnyire exponenciális jelleggel követi
- határozatlan jellegű kapcsolat – tartalmaz egy lineáris és egy vagy több kúpszelet-jellegű (parabola, hiperbola) részt (ez elég gyakori természeti változók esetében)
független lineáris monoton határozatlan
kapcsolathiány (pozitív) (negatív) Spearman-féle
Lineáris kapcsolatban használjuk: a lineáris korrelációs együtthatót – r-
- A korrelációs mutató értéke azt mutatja, hogy hány %-os valószínűséggel van lineáris kapcsolat a vizsgált ismérvek között.
–1< r <+1
- ha mínusz előjelű az r – az egyik ismérvérték növekedésével a másik csökkenő:
(a –0,9-es érték is szoros kapcsolatot mutat).
- Az r érték abszolút értékben annál nagyobb, minél szorosabban esnek a pontok egy képzeletbeli egyenes mentén.
- A lineáris korrelációs együttható számításának matematikai alapja az ún. legkisebb négyzetek módszere: keressük azt az egyenest, amely átlagosan a lehető legközelebb esik valamennyi ponthoz – a behúzott egyenes esetében a pontok ugyan szóródnak az egyenes mentén, mégis „adják” azt. (a word-program diagramrajzolója nemcsak „megkeresi” azt az egyenest és az egyenes egyenletét is kiszámítja)
Regresszió – analízis
- Két változó közötti korrelációs összefüggés esetén függvényszerűvé alakíthatjuk a kapcsolatot, hogy egy újabb egyed megjelenésekor az egyik ismérvértékéből következtetni tudjunk a másik ismérvértékére.
- Az egyenes egyenlete y=mx+a, amelyben az m megadja az egyenes meredekségét, az a érték pedig, hogy milyen magasan metszi az y tengelyt.
Az m (regressziós együttható) és az a értéke a következőképpen határozható meg:
m ismeretében pedig az egyenlet átrendezésével: a =
m×
:
- word diagramszerkesztője is képes ábrázolni az adatokat és a regressziós egyenest, a korrelációs együtthatót (R2) is kiszámolni.
- Ugyanezt az értéket adja az excel korrel (correl) nevű függvénye is
Kapcsolatvizsgálatok (Yule-próba, khi-négyzet próba)
feb 10th
Statisztika, 10. tétel, pszichológia távoktatás
Kapcsolatvizsgálatok (Yule-próba, khi-négyzet próba)
(számítás)
Berei Kati által kidolgozva
Asszociációs kapcsolatban használjuk:
- alternatív kapcsolat esetén – két-két ismérv van – Yule-mutatót
- kettőnél több ismérv-változat esetén – khi-négyzet próbát
Yule-féle asszociációs együttható
A kontingenciatábla:
| Csoport | B1 | B2 |
| A1 | f11 | f12 |
| A2 | f21 | f22 |
A Yule Mutató
Tulajdonságok: -1 £ Y £ 1
- függetlenség esetén Y = 0 (fordítva nem igaz! Előfordulhat ugyanis, hogy az noha különböző értékek vannak a cellákban Az f11×f22 szorzat értéke megegyezik az f21×f12-ével.)
- függvényszerű kapcsolat esetén ïYï = 1 (fordítva nem igaz! Lehet ugyanis olyan táblázatunk, amelyben az egyik cella értéke nulla, azzal 0 lesz azon szorzatpár értéke is)
- sztochasztikus kapcsolat esetén 0 < ïYï < 1
- Y > 0 ha f11f22 > f21f21 vagyis az azonos indexek jobban vonzzák egymást.
A Yule-próba hibái:
- ha az egyik cella értéke 0 megtévesztő, függvényszerű kapcsolatot is kimutathat (Y=1)
- ha két szorzat értéke ugyanaz, nem alkalmas a szorosság kimutatására (Y=0)
Khi – négyzet próba c2
Akkor használjuk ha:
- ha fenti okok miatt nem felel meg a Yule-mutató
- ha ismérvenként több osztály van, vagyis nagyobb a kontingencia-táblázatunk
- várt érték, s cellánként a kiinduló értékekből számítható:
Tulajdonságok:
→ 0 £ c2 £ N min(s-1, t-1)
→ c2 = 0 akkor és csak akkor, ha a két ismérv független
→ c2 = N (s-1) akkor és csak akkor, ha a két ismérv függvénykapcsolatban áll, ekkor s=t
Egyszerűbben:
- ha c2 = 0, akkor nincs összefüggés a csoportképző ismérvek között
- ha c2 ≠ 0, akkor feltételezhető a kapcsolat
A c2 mutató azonban csak áttételesen utal a kapcsolat szorosságára, mivel nem elégíti ki a valószínűségi mutatóval szemben állított azon követelményt, hogy értéke nulla és egy közé essen.
Két eljárás is van a c2 valószínűségi mutatóvá alakítására.
A Csuprov-féle asszociációs együttható (T)
- a kontingenciatábla nagyságával és a teljes elemszámmal viszonyítja a khi-négyzet mutatót:
, ahol s – sorok száma, o – oszlopok száma
A Cramer-féle asszociációs együttható
- hasonló módon alakítja át a khi-négyzet mutatót, de a táblanagyságból csak a kisebb osztályszámú sort vagy oszlopot veszi figyelembe:
Cramer-féle asszociációs együttható tulajdonságai:
→ ha s = o, akkor C = T
→ C = 0 akkor és csak akkor, ha a két ismérv független
→ C = 1 akkor és csak akkor, ha a két ismérv között függvénykapcsolat áll fenn.
35% -gyenge
35-70% közepes
70% fölött szoros kapcsolat
Részsokaságok vizsgálatának alapjai
feb 4th
Statisztika, 9. tétel, pszichológia távoktatás
Részsokaságok vizsgálatának alapjai
(kapcsolatvizsgálatok a változók típusa szerint, felsorolás és a próbák megnevezése, tan útmutató 1/11-12 old)
Berei Kati által kidolgozva
Heterogén a sokaság ha a vizsgált ismérvek szempontjából lényeges tulajdonságokkal bír, ilyenkor célszerű újabb ismérv(ek) szerint részsokaságokra bontani.
A részsokaságokra bontásnál – fontos szempontok:
- a sokaság bármely eleme besorolható legyen egy és csakis egy osztályba
- a besorolás homogén csoportot eredményezzen.
Ha részsokaságokra bontjuk, más elemzéseket is végezhetünk – továbbvihetjük a vizsgálatot, kapcsolatokat vizsgálhatunk különböző szempontok szerint. A vizsgálat eszköze a kontignencia-tábla.
Milyen kapcsolataink lehetnek?
- Nincs kapcsolat, ha az egyik csoportképző ismérv értéke semmilyen információt nem hordoz a másikéról
- , ha az egyik ismérv értéke egyértelműen meghatározza a másikét, akkor függvényszerű a kapcsolat
- Ha az egyik ismérv értékéből a másik ismérv értékeinek csak az eloszlása adódik, ha csak valamilyen valószínűséggel jellemezhetjük, akkor sztochasztikus kapcsolatról beszélhetünk.
Sztochasztikus (statisztikai) kapcsolat – valószínűségi kapcsolat:
- van amikor az egyik ismérvcsoporthoz való tartozásból nagy valószínűséggel következtethetünk a másik ismérvcsoportra, s van amikor nagyon laza ez a kapcsolat.
- mérőszámai 0 és 1 közötti értéket vehetnek fel:
0 a kapcsolathiányt jelzi
1 függvényszerű kapcsolatot jelent
. Ha a kapcsolati mutató plusz előjelű, akkor az egyik ismérvérték növekedésével a másik ismérvérték várhatóan szintén növekvő
mínusz előjel esetén pedig fordított: az egyik ismérvérték növekedésével a másik ismérvérték várhatóan csökkenő:
0 < K < ±1 → 0 < |K| < 1
A kapcsolat szorosságát mutató érték százzal megszorozva százalékos formában is kifejezhető.
0 < |K|< 0,35 – gyenge kapcsolat – 35%
0,4 < |K| < 0,65 – közepes kapcsolat – 35-70%
0,7 < |K| – szoros kapcsolat – 70% fölött
Az ismérvek közötti kapcsolat lehet:
- asszociációs kapcsolat:
- minőségi (nominális) vagy területi ismérvek között
- ha a csoportképző ismérvek minőségi skálával jellemezhetők: az egyik ismérv nominális (névleges), a másik nominális vagy ordinális (sorrendi)
- használt próbák:
- alternatív kapcsolat esetén (két-két ismérv van): Yule- mutató
- kettőnél több ismérv-változat esetén : khi négyzet próba
- a khi négyzet próbát valószínűségi értékké átalakítja a:
- Cramer–mutató
- Csuprov féle assziciációs együttható
- vegyes kapcsolat:
- ha az egyik ismérv minőségi a másik pedig mennyiségi
- ha a független változó (az ok) minőségi vagy területi ismérv, a függő változó (az okozat) pedig mennyiségi ismérv.
- A mennyiségi ismérv lehetőséget ad arra, hogy felhasználjuk az adatok átlagát és a szórását a kapcsolatszorosság mérésére: belső variancia számítás, külső variancia számítása és ezek összege a teljes variancia
- korrelációs kapcsolat:
– mindkét ismérv mennyiségi (intervallum vagy arányskálán mérhető)
– A kapcsolat monoton jellegű és nem függvényszerű: egyik független változó módosulásával a másik független változó is változik
– mérésre: a lineáris korrelációs együttható: –1< r <+1 értéket vehet fel.
- rangkorrelációs kapcsolat – ha mindkét változó sorrendi (ordinális) skálán mérhető, célszerű a Spearman-féle rangkorrelációs együtthatóval vizsgálni a kapcsolat szorosságát.
Adatok összehasonlítása: viszonyszámok fajtái
feb 3rd
Statisztika, 8. tétel, pszichológia távoktatás
Adatok összehasonlítása: viszonyszámok fajtái
(számítás)
Berei Kati által kidolgozva
Viszonyszám:
- két egymással kapcsolatban álló statisztikai adat hányadosa: tárgya /alapja
Pl. GDP/fő – tárgya: GDP; alapja: az ország lakossága.
- osztással hozzuk létre, tehát a mértékegységeket le lehet egyszerűsíteni
- 1. Megoszlási viszonyszám:
- azonos típusú adatok hányadosa
- Megmutatja, hogy egy részadat hogyan viszonyul a részadatok összegéhez: részsokaság adata/teljes sokaság adata:
- Pl. férfiak aránya a népességen belül: ha egy községben 512 nő és 489 férfi él, egy városban pedig 78.220 nő és 78056 férfi, akkor a megoszlási viszonyszámok:
| Falu | Város | Összesen | ||
| fő | megoszlás | fő | megoszlás | |
| Férfi | 489 | 48,85% | 78056 | 49,95% |
| Nő | 512 | 51,15 | 78220 | 50,05% |
| Összesen | 1001 | 100% | 156276 | 100% |
- a szövegszerkesztők diagramkészítői a megoszlási viszonyszámhoz illő kördiagramot készítenek (nekünk csak fel kell venni az adatokat, nem is kell kiszámolni az értékeket)
- 2. Intenzitási (koordinációs) viszonyszám
- eltérő típusú adatok hányadosa: egyik részsokaság adata/másik részsokaság adata pl. ezer nőre jutó férfiak száma; 1000 szülésre jutó élveszületések száma
- jól használhatók a társadalmi-gazdasági jelenségek színvonalának jellemzésére és eltérő nagyságú de hasonló adatok összehasonlíthatóvá tételére
- általában ezer főre adják meg a statisztikusok (ezer lakosra jutó televíziók száma, ezer háztartásra jutó gépkocsik száma).
Pl. Falu:
ha 512 nő aránylik a 483 férfihez, akkor 1000 nő hogyan aránylik X férfihez:
Az egyenlet átrendezésével:
Azaz az 1000 nőre jutó férfiak száma 955.
Ugyanez a városi megoszlásra:
Az egyenlet átrendezésével:
Megállapítható tehát, hogy a városban kiegyensúlyozottabb a nemek aránya.
- 3. Dinamikus viszonyszámok
- azonos típusú adatok hányadosa
- jellegzetesen az idősorok elemzésére alkalmas.
- kétféle lehet: bázisviszonyszám és láncviszonyszám
Bázisviszonyszám:
— tárgyidő adata/bázisidő adata (általában az idősor első évét tekintjük bázisnak, ehhez viszonyítjuk a többi év adatát)
— Megmutatja a változás arányát, 100-zal szorozva százalékos formában:
Láncviszonyszám:
- idősoroknál minden egyes év adatát az azt megelőző időszak adatához viszonyítjuk, megmutatja a változás dinamikáját:
Figyelem: megoszlási viszonyszámot értelemszerűen csak arányskálán
(valódi 0-pontú) mért adatokból lehet számítani!
Statisztikai adatok elemzése grafikus ábrázolással
feb 3rd
Statisztika, 7. tétel, pszichológia távoktatás
Statisztikai adatok elemzése grafikus ábrázolással
(lehetőségek megnevezése)
Berei Kati által kidolgozva
- A számszerű statisztikai adatokat célszerű diagramon ábrázolni
- a szövegszerkesztő programok (pl. a word is) rendelkeznek ilyen alprogramokkal.
- 1. Vonal diagram
- folytonosan változó adatokat célszerű ábrázolni, ezzel is sugalmazzuk az adatok folyamatosságát.
- pl. egy édesanya naponta megméri csecsemője súlyát . A napi adatpontokat joggal kötheti össze, hiszen a csecsemő súlya folyamatosan változik. A függőleges tengely kezdőpontját hozzáigazíthatjuk a legkisebb adathoz (esetünkben 3,5 kg-nál kezdődik a tengely skálázása), ezzel „megnyújtjuk”, szemléletesebbé tesszük a változást:
- 2. Oszlop- (sáv-) diagram
- célszerű a diszkrét adatok ábrázolására használni.
Hisztogramok, gyakorisági poligonok
- ezek az eloszlások grafikus ábrázolásai:
- hisztogram – olyan téglalapokból áll, amelynek alapjai a vízszintes tengelyen vannak, középpontjuk az osztályköz, szélességük megegyezik az osztályköz hosszával, magasságuk, s ezáltal területük arányos az osztálygyakorisággal.
- gyakorisági poligon – a gyakorisági sor osztályközepek alapján rajzolt vonaldiagramja, melynél a vonal alatti terület megegyezik a hisztogram területével.
A statisztikai megfigyelés: sorok, táblák
feb 3rd
Statisztika, 6. tétel, pszichológia távoktatás
A statisztikai megfigyelés: sorok, táblák
(lehetőségek megnevezése, adatok rendezése, idősor, kontingenciatáblázat)
Berei Kati által kidolgozva
A statisztikai munka fázisai:
- megfigyelés – számbavétel, adatfelvétel
- feldolgozás – csoportosítás, összesítés
- elemzés – feltárni összefüggések feltárása, következtetések levonása
- jellemzés
- Sok adat esetén áttekinthetőbb ha csoportosítjuk, osztályba soroljuk őket.
Statisztikai sor
– az adatok meghatározott ismérv szerinti, csoportosított felsorolása főképpen összehasonlítási célból
– a csoportosítási ismérv szerint lehet:
- minőségi
- fogalmilag meg van határozva, pl. férfi – nő
- valamely minőségi (többnyire nominális) ismérv szerint csoportosítja az adatokat önmagában (egy adott időpontra vonatkoztatva), illetve idősorral vagy területi sorral kombináltan.
pl. befejezett iskolai tanulmányok 1950. és1999. között
- mennyiségi – tulajdonságokon alapoló mennyiség, két számsor alkotja
- ezeket az adatokat rendezhetjük – rangsorolhatjuk nagyság szerint (pl. emelkedő sorba) vagy rendezhetjük gyakorisági sorba – osztályokba eloszlás szerint
- időbeli állapot – tartam, pl. álló – mozgó sokaság
- térbeli
- leíró – egy-egy eltérő ismérvű, de logikailag összefüggő adatokat tartalmaz
– A statisztikai sorok legjellemzőbb vizsgálata a viszonyszámokkal történik.














Legutóbbi hozzászólások