Page 11 - MaSzeSz hírcsatorna 2024/2.
P. 11
SZAKMAI - TUDOMÁNYOS ROVAT
mátrix a főkomponens-elemzés alapvető
kiinduló eleme. Megmutatja az adatkész-
let változói közötti kapcsolatot. Egytől mí-
nusz egyig terjed. A pozitív értékek pozi-
tív korrelációt jeleznek a változók között;
együtt szoktak növekedni vagy csökkenni.
Negatív korreláció esetén az egyik változó
növekszik, ahogy a másik csökken. Minél
közelebb van az érték plusz vagy mínusz
egyhez, annál erősebb a korreláció. A kor-
relációs mátrix segít azonosítani a mintákat
és a redundanciákat az adatokban. A PCA
elemzi ezt a mátrixot, hogy meghatároz-
za a főkomponenseket az Eigen kritérium
segítségével.A főkomponens-analízissel
aazonosítottuk a szórások többségéért
felelős komponenseket, de további elem-
zésre van szükség annak megértéséhez,
hogy ezek a főkomponensek milyen ha-
tással vannak a vízfogyasztásra. A többszö-
2. ábra: Vizsgált agglomerációs települések rös regressziós elemzés (MRA) a kutatás
utolsó lépése. Az MRA-ban van egy füg-
A kutatás tárgyául szolgáló kiválasztott tizen- gő változó, esetünkben a vízfogyasztás és
egy agglomerációs várost és községet a Fő- a független változók, esetünkben az előző
városi Vízművek üzemelteti. Méretük 1011 PCA analízisben azonosított főkomponen-
és 40560 fő között változik. Három terüle- sek. Az MRA célja a függő és a független
ten találhatók, Budapesttől északra, főként változók közötti kapcsolat vizsgálata és
a Szentendrei-szigeten, Budapesttől nyugatra a függő változó előrejelzése. Ebben a ku-
és a fővárostól délre. tatásban a vízfogyasztás és a főkompo-
nensek kapcsolatának vizsgálata áll a kö-
A főkomponens-analízis első lépéseként zéppontban, előrejelzés nem készül, mivel
az adatok standardizálására kerül sor nem ez a kutatás célja. Minden független
Z-score normalizálással, ami során ki kell változót a regressziós analízis súlyoz, a sú-
számítanunk az adott változó középérté- lyok a független változó relatív hozzájáru-
két, majd a szórást is. Az egyes adatpontok lását jelzik a függő változó összértékéhez,
standardizált értékének megszerzéséhez megkönnyítve az értelmezést. A független
az eredeti változóból ki kell vonni a közé- változók közötti korreláció alkotja a reg-
pértéket, majd el kell osztani a szórással. ressziós egyenletet, a független változók
Ezáltal az eltérő mértékegységű adatok lineáris kombinációját, amely a legjobban
összevethetőek. A következő lépés a kor- leírja a függő változót(Hair, Black, Babin, &
relációs mátrix létrehozása.A korrelációs Anderson, 2010).
11