De la clasic la SEM. Ce trebuie să știm pentru a utiliza eficient SEM? (I/III)

Acest articol este extras din cursul „Modele de ecuații structurale” pe care voi avea onoarea și plăcerea să-l susțin la Universitatea București începând cu al doilea semestru și, dacă se vor alinia astrele, la școala de vară de la Iași ce va avea loc în luna iulie 2018. De asemenea, doritorii vor putea accesa, în curând, cursul complet în regim eLearning pe portalul „New Skills Learning”. Sper să vă placă și aștept opiniile și comentariile dumneavoastră.

Cunoștințe preliminare analizei prin metodologia SEM

Prin definiție, metodele SEM nu au un caracter exploratoriu, ele nu urmăresc să „descopere” ceva, ci au în vedere testarea unui model, doresc să „confirme”, chiar dacă mai sunt și excepții. Dacă vorbim despre un model preexistent, atunci devine evident faptul că acesta nu poate să apară din neant, el trebuind să existe nu doar în mintea cercetătorului, ci și „pe hârtie”, însă pentru ca acest lucru să se materializeze, trebuie să se acumuleze cunoștințe foarte solide în domeniul ce urmează a fi studiat.

Metodologia SEM nu ne lasă să fim diletanți, cunoașterea domeniului reprezentând, poate, cel mai important lucru, asta însemnând o parcurgere temeinică a literaturii din zona de interes, o însușire a cercetărilor efectuate până în prezent, a teoriilor și modelelor existente. Ideea preconcepută cum că un cercetător este o sumă de „r”-uri, de „p”-uri și de click-uri pe butoanele unor programe de analiză de date iar pentru a fi cercetător este suficient să știi analiză de date nu-și are locul în metodele SEM, deoarece acestea pleacă de la rolul real al cercetării, acela de a ajunge la cunoaștere. Așa cum spunea Rex Kline, „valoarea rezultatelor numerice depinde de calitatea ideilor (a ipotezelor) pe care se bazează analiza” (Kline, 2011) sau, cu alte cuvinte, „dacă bagi gunoi, gunoi iese”.

De multe ori, analizele SEM se implementează pornind de la variabile manifeste ale căror scoruri rezultă în urma administrării unor instrumente mai mult decât discutabile din punct de vedere al caracteristicilor lor de măsurare, referindu-ne, în special, la validitate și la fidelitate. Aceasta este calea certă către eșec, iar dacă adăugăm și lipsa controlului calității datelor colectate, atunci mai bine ne apucăm de altceva. Nu putem estima variabile latente, nu putem discuta despre testarea modelelor teoretice dacă nu știm, de fapt, ce măsurăm, cu atât mai mult cu cât măsurarea în domeniile socio-umane, se cunoaște, nu excelează în precizie. Iată că un alt lucru foarte important pe care trebuie să-l abordăm înainte de a ne gândi la metodologia SEM, ține de proprietățile psihometrice ale instrumentelor utilizate, aspect peste care se trece cu multă ușurință. Dacă ar fi să privim obiectiv, în foarte multe cazuri eșecul susținerii unui model nu este cauzat de incorecta sau deficitara specificare a acestuia, chiar dacă acolo își îndreaptă prima dată cercetătorii atenția, ci de calitatea îndoielnică a instrumentelor utilizate sau de lipsa controlului asupra colectării datelor.

La urma urmei, toată metodologia SEM se bazează pe regresii, fiind necesare cunoștințe foarte solide în domeniul corelațiilor și regresiilor multiple, tehnici considerate clasice. Există destul de multe persoane, care, fără să înțeleagă bine rolul metodologiei SEM, privesc cu superioritate tehnicile clasice și le consideră depășite. Nimic mai fals, din mai multe motive. În primul rând, fără înțelegerea regresiilor nu se pot înțelege modelele SEM iar fără cunoașterea corelațiilor nu se pot înțelege regresiile. Totul face parte dintr-un lanț de cunoștințe iar lipsa unei verigi face ca întreaga construcție să se prăbușească. Apoi, marea majoritatea a rezultatelor SEM se interpretează exact ca regresiile multiple și nu ar fi de dorit să ne apucăm de tras tot felul de concluzii savante pe care nici noi să nu le înțelegem.

Chiar dacă sunt mai puțin prezente, testele statistice au un rol destul de important și în modelele SEM, atât la testarea globală a modelului, cât și la analiza coeficienților estimați, din acest motiv sunt absolut necesare cunoștințele din domeniul testării semnificației statistice a ipotezei nule și cele ce vizează utilizarea și interpretarea testelor statistice. Ar trebui să fim rezervați în fața cuiva care discută despre o cercetare științifică în termeni de confirmare și nu de infirmare, demers contrar științei și specific pseudo-științei sau care, pe baza „p”-ului, confirmă o ipoteză de cercetare, fiind ușor demonstrabil faptul că „p”-ul nu are nicio legătură cu ipoteza alternativă, ci doar cu ipoteza nulă. Din păcate, de mult prea multe ori se confirmă ipoteze de cercetare în loc să se respingă ipoteza nulă, se ignoră reguli elementare ale inferenței statistice sau nu se vorbește despre semnificația practică, lucruri care limitează înțelegerea și utilizarea corectă a modelelor SEM, ce tind, prin natura lor, către pretenții de confirmare, generalizare, chiar și înspre relevarea de relații cauzale.

Tehnicile SEM sunt tehnici pretențioase, mai ales sub aspectul calității datelor colectate, prin urmare cunoștințele din domeniul analizelor univariate sunt indispensabile. Va trebui să înțelegem distribuțiile variabilelor manifeste, cum tratăm scorurile extreme și cazurile lipsă, cum purificăm datele și ce transformări liniare ne este permis să facem pentru a ajunge la îndeplinirea asumpțiilor specifice analizei. Entuziasmul tineresc al cercetătorilor este benefic pentru cunoaștere, însă numai dacă se respectă rigoarea metodologiei științifice, altminteri se transformă în pseudo-cunoaștere, în pseudoștiință. Această rigoare vizează două elemente majore, poate cele mai importante, însă trecute nepermis pe planul al doilea: îndeplinirea asumpțiilor tehnicii și garantarea calității datelor colectate. Dacă asumpțiile tehnicii nu sunt îndeplinite, atunci rezultatele nu sunt corecte, chiar în cazul în care datele sunt bune sub aspect calitativ, însă dacă datele nu sunt de calitate, atunci nu prea mai avem despre ce să vorbim. Așa cum avem grijă ca într-o mașină ce funcționează cu benzină să nu putem motorină, respectând asumpția combustibilului pentru motor, la fel de atenți ar trebui să fim și cu asumpțiile tehnicilor de analiză de date, fie că vorbim despre cele clasice sau despre modelele SEM. Dacă unii mai încurcă pompa de benzină cu cea de motorină, din necunoaștere, neatenție sau entuziasm, cei care ar turna apă în rezervor și ar spera să pornească motorul ar fi caracterizați prin cu totul altceva. Transpus în domeniul cercetării, acest lucru este echivalent cu a colecta date fără a fi interesați de proprietățile instrumentului de măsură sau de calitatea acestora.

Noțiuni de analiză clasică necesare utilizării metodologiei SEM

Cu toate că desenatul modelelor în „diagrammer” poate părea o activitate distractivă, ce induce ideea că analizele SEM sunt ușoare, realitatea este cu totul alta; ele nu sunt deloc ușoare și nici nu au apărut pur și simplu, ci se află în strânsă relație cu unele tehnici clasice, mai ales cu analiza componentelor principale, regresia multiplă și analiza de varianță, de aceea, foarte pe scurt, în acest capitol ne vom reaminti principalele aspecte ale metodelor clasice, pentru a porni de la baze solide.

Înainte de toate, să ne imaginăm că dorim să aflăm dacă anxietatea populației de studenți din Constanța diferă statistic semnificativ de anxietatea studenților din România. Presupunând că avem o scală de anxietate foarte bună, extragem un eșantion de studenți din populația studenților din Constanța, aflăm media eșantionului la anxietate și, considerând că știm media la anxietate a studenților din România, utilizăm unul dintre cele mai simple teste statistice, mai exact testul t-Student pentru un singur eșantion. Dacă vom complica puțin lucrurile, ne-am putea propune să vedem dacă anxietatea studentelor din Constanța diferă de cea a studenților constănțeni, caz în care vom folosi un test ceva mai general, testul t-Student pentru două populații din care provin eșantioanele iar dacă scopul cercetării este să urmărim eficiența unei terapii pentru reducerea anxietății, am putea folosi o serie temporală cu două momente – măsurarea anxietății înainte și după terapie – și vom trece la un nivel mai înalt, testul t-Student pentru eșantioane perechi.

În toate aceste scenarii am avut o singură variabilă dependentă (anxietatea) și ne-a interesat efectul exercitat asupra acesteia de o variabilă independentă cu doar două niveluri (locul studenților, genul biologic, respectiv manipularea experimentală). În cazul în care apar mai multe niveluri, testele t-Student devin inutile și trebuie să utilizăm modele mai generale. Dacă vrem să studiem existența unor diferențe statistic semnificative între anxietatea studenților, cea a profesorilor și cea a personalului non-didactic, atunci intrăm în domeniul analizei de varianță (ANOVA), ce ne ajută să aflăm efectele unei variabile independente cu mai multe niveluri asupra unei singure variabile dependente (ANOVA unifactorial), a mai multor variabile independente cu două sau mai multe niveluri asupra unei singure variabile dependente (ANOVA univariat) sau a mai multor variabile independente cu două sau mai multe niveluri asupra mai multor variabile dependente (ANOVA multivariat sau MANOVA).

Analiza de varianță reprezintă un grup de tehnici foarte frumoase și foarte puternice atunci când nivelurile variabilelor independente sunt relativ puține. Dacă dorim să utilizăm variabile continui sau chiar variabile categoriale, dar cu multe niveluri (cum ar fi nivelul educațional, nivelul venitului, grupul de vârstă, partidele politice sau spațiile de răspuns ale unor itemi), pe post de variabile independente, tehnicile ANOVA devin foarte greu de implementat, dacă nu chiar inutile, atât din cauza numărului prohibitiv de observații ce vor trebui colectate, cât și a cvasi-imposibilității respectării asumpțiilor.

Este momentul în care intră în scenă tehnicile de regresie multiplă, metode ce permit utilizarea variabilelor continui sau categoriale atât pe post de variabile independente, cât și pe post de variabile dependente. În cadrul unui model de regresie, putem avea de a face cu o singură variabilă dependentă (numită și criteriu) prezisă de una sau mai multe variabile independente, categoriale sau continui (numite și predictori) sau de mai multe criterii prezise în același mod (cazul modelelor multivariate de regresie). De asemenea, criteriile pot fi continui (cazul regresiilor liniare), dihotomice (cazul regresiilor logistice) sau categoriale, nominale ori ordinale, cu mai mult de două categorii (cazul regresiilor categoriale sau multinomiale).

Deja am atins un nivel destul de ridicat al analizei de date, însă ne aflăm tot pe tărâmul tehnicilor clasice, chiar la granița cu modelele de ecuații structurale. Regresiile, deși foarte puternice, sunt limitate doar la variabile manifeste, au o serie de asumpții nerealiste din punct de vedere practic și permit specificarea doar a unui singur tip de relație. Variabilele pot fi ori independente (predictori), ori dependente (criterii), modelul fiind reprezentat printr-o ecuație unică iar situațiile în care una și aceeași variabilă ar trebui să funcționeze drept predictor într-o parte a modelului și criteriu în altă parte nu pot fi specificate prin intermediul regresiilor, acesta fiind momentul în care intervine SEM.

Scala de anxietate, pe de altă parte, presupune o altfel de abordare. Ea conține un număr destul de mare de itemi și ne putem pune întrebarea cum a fost construită. Dacă vom lua primii doi itemi, atunci ca să conchidem că ei măsoară același lucru, trebuie să aibă ceva în comun, să fie „legați” prin ceva anume, acel „ceva” fiind tocmai anxietatea. Am ajuns la corelațiile bivariate, expresia legăturii dintre două variabile și dacă vom calcula coeficientul de corelație dintre itemii 1 și 2, cel mai probabil vom obține o legătură statistic semnificativă, cu un efect mediu, dacă nu puternic. Iată cum am ajuns la problema comunalității, adică a acelui „ceva” pe care îl au în comun cele 2 variabile, dar pe care nu le putem trata în termeni de variabilă dependentă sau independentă, ambele având același rol.

La introducerea celui de-al treilea item lucrurile se schimbă, deoarece corelația dintre primii doi (numită și corelație de ordin zero) nu mai este valabilă, pentru că apariția itemului 3 modifică „elementul comun”, aducând atât plus de informație, cât și plus de eroare. Ne putem acum gândi care ar fi corelația dintre primii doi itemi dacă am menține constant efectul determinat de itemul 3 (în termeni de specialitate, spunem că vom controla sau izola efectul itemului 3). Vom constata că se reduce, similar urmând să controlăm efectul itemului 1 și efectul itemului 2, în relație cu ceilalți doi rămași. Am ajuns la corelațiile parțiale și semi-parțiale, în exemplul de față vorbind despre corelații de ordinul 1, deoarece controlăm efectul unei singure variabile. Dacă am repeta procedura pentru toți itemii scalei de anxietate, presupunând că scala are 60 de itemi, am ajunge la o muncă realizabilă manual în câțiva ani, adică la corelații de ordinul 60, intuind că intrăm în domeniul analizei factoriale.

Din punct de vedere al tehnicilor clasice, analiza factorială este una exploratorie, în care explorăm aceste corelații parțiale pentru a identifica factorii comuni. Caracterul exploratoriu nu este însă dat de diletantism, nu este ca și cum am aduna, la grămadă, 60 de itemi, apoi îi analizăm pentru a vedea dacă au sau nu au ceva în comun. Dacă am proceda astfel, atunci nu am reuși niciodată să construim vreun instrument. Chiar dacă explorăm, avem deja o ipoteză construită, itemii au fost deja aleși în funcție de comportamentele presupuse a fi saturate cu anxietate. Analiza factorială este exploratorie nu pentru că urmează să descoperim ceva necunoscut; noi știm bine ce vrem să găsim, ci pentru că această ipoteză, conform căreia cei 60 de itemi au în comun, mai precis, anxietatea, nu poate fi postulată dinainte, nu poate fi specificată a priori.

Din momentul în care Spearman a pus bazele analizei factoriale, s-a descătușat potențialul instrumentelor de măsură în domeniul socio-uman, metoda reprezentând și acum una dintre cele mai utilizate tehnici din psihometrie și nu numai, doar că, tradițional, analiza factorială exploratorie nu poate stipula nicio relație între factorii descoperiți pe baza unicității, aceștia fiind presupuși ca necorelați. Mai departe, metodele de rotire sporesc vizibilitatea factorilor, dar fără a afecta structura acestora, aici putându-se pleca de la prezumpția că factorii ar fi necorelați (rotirile ortogonale) sau corelați (rotirile oblice), însă este vorba despre cu totul altceva, analiza factorială exploratorie, atunci când extrage componentele, nu poate implementa niciun fel de relație între ele.

Ținând cont de aceste două limitări importante, dar și de alte neajunsuri, s-a făcut trecerea de la tehnica analizei factoriale exploratorii clasice, la analiza factorială confirmatorie, o metodologie bazată pe modele de ecuații structurale. Deoarece aici factorii sunt variabile latente, ipoteza cercetătorului privind felul în care acestea saturează itemii poate lua forma unui model, fiind postulată a priori. Mai mult decât atât, nu există nicio limitare în a stabili relații nedirecționale (de tipul corelațiilor) sau direcționale (de tip efect) între variabilele latente, putând fi analizate în același timp. Așa cum vom discuta ceva mai târziu, partea dintr-un model ce se ocupă de relațiile factorului latent cu indicatorii săi (cu itemii) se numește partea de măsurare a modelului iar celelalte relații specificate intră în componența părții de structură a modelului.

Constatăm că fundația metodologiei SEM este construită pe modelele de regresie și pe corelații, acestea fiind motivele pentru care ar fi o idee bună dacă ne-am readuce aminte, pe scurt, de câteva principii ale corelațiilor bivariate, ale celor parțiale și ale regresiilor, chiar cu riscul de a relua lucruri bine știute. Deoarece SEM folosește și testarea semnificației statistice a ipotezei nule, chiar dacă mai puțin vizibil, ne vom reaminti și o serie elemente privind erorile standard, ipoteza nulă, testele statistice și vom face câteva mențiuni legate de tehnicile de reeșantionare, cunoscute și sub denumirea de „bootstrapping”. Ne vom asigura astfel că avem toate bazele unei înțelegeri sănătoase a metodologiei SEM, fără a mai exista riscul efectuării unor erori conceptuale elementare, așa cum, din păcate, se întâlnește destul de des.

În următoarele două articole doar vom reaminti și vom fixa cunoștințele, deoarece presupunem că cei interesați de SEM au deja informații solide privind analizele clasice de date.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Acest sit folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.