Faceți căutări pe acest blog

vineri, 8 august 2014

De ce sondajele online nu contează

Rezultatele unui sondaj arată ceva despre o populație. Poate fi vorba de românii cu drept de vot sau  de pensionarii din Moldova sau de fumătorii cu vârsta sub 30 de ani. Dar:
- Întotdeauna această populație este identificată înainte de efectuarea sondajului.
- Cu excepția unor cazuri absolut speciale, nu poți întreba toți membrii populației și de aceea trebuie chestionat un eșantion, adică un grup din interiorul populației.

Întrebările care apar sunt:

1) este eșantionul corect selectat? Dacă vreau să măsor intenția de vot a femeilor din România la prezidențiale dar pun și bărbați să răspundă.. nu mai măsor ce vreau să măsor.

2) este eșantionul suficient de mare pentru a măsura ce vreau să măsor? Pot întreba 10 locuitori din Galați apropo de intenția lor de vot, dar marja de eroare e prea mare (adică ei sunt prea puțini) până și pentru a putea trage concluzii apropo de Galați, darămite despre România.

3) este eșantionul reprezentativ? Pot întreba o mie sau zece mii de timișoreni despre intenția lor de vot, dar dacă efectuez sondajul miercurea între 10 și 12 dimineața, între acele ore o să fie acasă disproporționat de mulți pensionari, casnice și șomeri și disproporționat de puțini oameni cu locuri de muncă. Imaginea pe care o formez despre votul timișorenilor este ... câș, greșită, dezechilibrată față de realitate. 

O greșeală e arhisuficientă. În 1936 revista Literary Digest a trimis cititorilor săi, precum și deținătorilor de automobile sau telefoane din SUA zece milioane de chestionare apropo de intenția lor de vot la prezidențiale. Două milioane patru sute de mii de persoane au trimis răspunsurile lor revistei. Dar rezultatul alegerilor a fost cu totul altul decât cel indicat de cititori. Literary Digest era o revistă care se adresa elitei și clasei mijlocii cu posibilități financiare considerabile. De asemenea, posesorii de mașini și telefoane erau, pe standardele epocii, upper-class. Aceștia erau cei cărora li se trimisese chestionarul. Dar "sondajul" vroia să măsoare intenția de vot a tuturor americanilor. Dacă oamenii mai săraci votau altfel decât ceilalți, "sondajul" urma să dea rezultate eronate. Și așa a și fost. Elita și partea superioară a clasei de mijloc susțineau candidatul republican. Însă democratul Franklin Delano Roosevelt a fost votat de cam tot restul națiunii și a câștigat.

Alt factor important e auto-selecția. În legătură cu majoritatea subiectelor există o "majoritate tăcută". Oamenii cu păreri puternice, într-un sens sau celălalt, vor pune mâna pe telefon sau vor completa chestionarul. Dar ei nu sunt reprezentativi. Poți să ai o forță politică de 3-4% care e hiper-mobilizată și un "gigant în adormire" de 30-50% compus din votanți care nu simt nevoia să-și exprime opinia politică ori de câte ori e posibil. În genere, de altfel, forțele minore sau minuscule sunt vocale întrucât resimt cu mai mare necesitate dorința de a convinge pe alții (sau de a intra în conflict cu status quo-ul). Un sondaj telefonic sau față-în-față elimină auto-selecția - participanții sunt selectați probabilistic.

Ce măsoară atunci un "sondaj online" de pe pagina unui ziar sau site? Cam nimic.

Nu măsoară opinia românilor cu drept de vot. Pentru că nu toți românii cu drept de vot au internet. Iar unii români fără drept de vot (ex. adolescenți) pot să răspundă, aspect mai puțin important dar și el sursă de erori.

Nu măsoară opinia românilor care au acces la internet. Pentru că acel site nu are cum să fie reprezentativ pentru toate site-urile din România. Hotnews, Antena3.ro și un blog despre îmbrăcămintea pentru copii ar avea rezultate complet diferite la sondaje privind opțiunea de vot, întrucât publicul lor e diferit. Dar, atenție...

... Sondajul nu măsoară nici opinia celor care accesează acel site. Unii răspund, unii nu, dar acest lucru nu se petrece pe baza unei randomizări, precum într-un sondaj serios, ci pur și simplu pe baza poftei fiecăruia. Intervine auto-selecția de care scriam mai sus. În toamna lui 2012, de exemplu, simpatizanții ARD se auto-selectau. Astfel, scorurile Alianței în "sondajele online" erau mult, mult mai mari decât au fost în ziua alegerilor.

Am scris "cam nimic" pentru că "sondajul online" poate măsura ceva, dar chiar și asta imperfect. E vorba de capacitatea unei organizații politice de a-și mobiliza susținătorii pentru a da click pe acel sondaj. Fiecare campanie conține faimoasele e-mailuri care se termină cu "și vă rog să dați click pe partidul/candidatul nostru la sondajele de pe site-urile astea: A, B, C, D, mulțumim". Bătălia asta nu are relevanță prea mare, întrucât n-are nimic de-a face cu eficiența organizației respective în teren, în lumea din afara Internet-ului. Ce-ai prefera - 100 de postaci care-ți câștigă toate sondajele de pe Internet sau 7 primari care-ți aduc câte 200 de voturi reale? De asemenea, la prezidențiale prezența e la cote imense, partidele contează mai puțin decât la alte alegeri.

E posibil ca un "sondaj online" să exprime cu adevărat opțiunea populației în legătură cu un subiect? Doar printr-o întâmplare. La fel de mari șanse ai și tu să intuiești procentele corecte: scrii toate combinațiile posibile pe bilețele și tragi la sorți. Până în 2012 inclusiv "sondajele online" erau dezechilibrate spre dreapta - publicul anti-PSD este ceva mai prezent pe Internet decât celălalt. PSD însă s-a mobilizat serios, din motive de PR, și a reușit să refacă acest semi-decalaj. Acum e haos total.

PS: Site-urile au libertatea să facă ce doresc. Bătălia pe click-uri generează accesări. Dar să nu confundăm "sondajele online" cu alegerile.

PS2: Există sondaje ca la carte (fără autoselecție) și care se efectuează online, conștientizându-se că ele măsoară exclusiv populația care are acces la Internet. Ele sunt aproape necunoscute în România, deși vor avea un viitor bun. Nu la ele făceam referire în titlul acestei postări.