Δευτέρα 28 Μαρτίου 2022

Η γαλλική οδός στην ανάλυση δεδομένων: 2. Η παραγοντική ανάλυση των αντιστοιχιών

Το παρακάτω απόσπασμα, το δεύτερο μέρος του οποίου δημοσιεύεται παρακάτω (για το πρώτο μέρος βλ. εδώ), προέρχεται από το 9ο κεφάλαιο του βιβλίου του Alain Desrosières, Pour une sociologie historique de la quantification, Παρίσι, Presses des Mines, 2008 εστιάζει στη γαλλική σχολή ανάλυσης δεδομένων στις κοινωνικές επιστήμες. [Η επιλογή του αποσπάσματος, η μετάφραση, καθώς και οι υποσημειώσεις με αστερίσκο είναι δικές μου - Δ. Λ.].  

ΙΙ. Ανάλυση δεδομένων και data analysis

Η λεγόμενη ανάλυση δεδομένων "γαλλικού τύπου", όπως δηλαδή προκύπτει από το έργο των Jean-Paul Benzécri και Brigitte Escoffier, συνδυάζει ταξινομητικές και μετρολογικές πτυχές. Βρίσκεται, άλλωστε, σε άμεση σύνδεση με την «παραγοντική ανάλυση» των ψυχομετρών, οι οποίοι ακολούθησαν την τυπική προσέγγιση της «συμπτωματικής» μετρολογίας των βιοεπιστημών (Benzécri, 1982). Η γενική ευφυΐα (ή "παράγοντας g") του Charles Spearman (1904) ήταν μια λανθάνουσα μεταβλητή, που αναφερόταν στο μέσο όρο βαθμολογίας που συγκέντρωναν p μαθητές μέσα από n σχολικά τεστ. Η μεταβλητή αυτή οριζόταν ως ο κύριος άξονας της αδράνειας του νέφους p σημείων που αντιπροσώπευαν την απόδοση των μαθητών σε έναν n-διαστατο χώρο δοκιμών. Η μονοδιάστατη φύση αυτού του νέφους συζητήθηκε και επικρίθηκε αρχικά από τον Burt και στη συνέχεια από τον Thurstone, οι οποίοι επιδιώκοντας να εξερευνήσουν ορθογώνιους άξονες, περιέγραψαν με μεγαλύτερη ακρίβεια την πολυπλοκότητα του χώρου των δεξιοτήτων. Χωρίς να χρησιμοποιούν υπολογιστές, οι ψυχομέτρες απέκτησαν μεγάλη επιδεξιότητα στο να θέτουν σε εφαρμογή την τεχνική της "περιστροφής των αξόνων" σε χώρους πολλών διαστάσεων. Αυτή η τεχνική, που χρησιμοποιήθηκε κυρίως από ψυχολόγους, ήταν ελάχιστα γνωστή στους κοινωνιολόγους στη Γαλλία, τουλάχιστον μέχρι τη δεκαετία του 1960.

Έτσι όμως, μια τόσο σημαντική εμπειρία παρέμενε απομονωμένη και χωρίς συνέχεια. Το 1954, ο Jean Porte, ο δημιουργός των κοινωνικο-επαγγελματικών κατηγοριών (ΚΕΚ), πραγματοποίησε στο INSEE [**] μια «δειγματοληπτική έρευνα για τους ακροατές του ραδιοφώνου», τον πρόγονο της κατηγορίας του κοινού. Χρησιμοποιώντας την «παραγοντική ανάλυση των προτιμήσεων», προεικονίζοντας, είκοσι-πέντε χρόνια νωρίτερα, τη Διάκριση του Bourdieu [***], ο Jean Porte πραγματοποίησε παραγοντική ανάλυση σε έναν πίνακα συσχετίσεων που περιείχε τις προτιμήσεις των ακροατών για διάφορα είδη ραδιοφωνικών προγραμμάτων. Για να πετύχει κάτι τέτοιο, χρησιμοποίησε τη λεγόμενη «κεντροειδή» μέθοδο του Thurstone: «Ένα τέτοιο εγχείρημα μπορεί δύσκολα να δικαιολογηθεί παρά μόνο αν το αποτέλεσμα στεφθεί με επιτυχία, δηλαδή αν παρέχει δυνατότητες ερμηνείας του αποτελέσματος» (Porte, 1954, σελ. 53). Ο Porte αφού πρώτα ερμήνευσε τον πρώτο παράγοντα, μέσα από την αντίθεση μεταξύ «ποιοτικών ραδιοφωνικών εκπομπών» και «ελαφρών ραδιοφωνικών εκπομπών», στη συνέχεια προχώρησε, μέσω μιας επιδέξιας περιστροφής των αξόνων (την οποία αναπαράστησε γραφιστικά), στο δεύτερο παράγοντα, ο οποίος αντιπαρέβαλε τις «μουσικές ραδιοφωνικές εκπομπές» με τις «εκπομπές συζήτησης». Ωστόσο, η ανάλυσή του αφορoύσε περισσότερο την εγγύτητα μεταξύ των ραδιοφωνικών εκπομπών και λιγότερο τη συσχέτιση μεταξύ των προτιμήσεων και των διαφορετικών ΚΕΚ (που αναλύθηκαν με πιο παραδοσιακές [στατιστικές] μεθόδους), ενώ ειδικά η παραγοντική ανάλυση δε θα τον οδηγήσει, τότε ακόμα, σε κάποια χαρτογράφηση, χαρακτηριστικό αργότερα της ανάλυσης αντιστοιχιών.

Παρά την ταύτιση όσον αφορά την ονομασία, η φιλοσοφία των γαλλικών μεθόδων ανάλυσης δεδομένων και των αγγλοσαξονικών data analysis, οι οποίες διαδόθηκαν από τους John Tukey και Eugène Horber, δεν είναι η ίδια (Deville and Malinvaud, 1983; Horber, 1990; Schiltz, 1991). Οι αγγλοσαξονικές μέθοδοι διακρίνουν με σαφήνεια την εξερευνητική ανάλυση, η οποία μέσα από μεθόδους εξέτασης και μια πολύ απλή απεικόνιση ενός αρχείου, καθιστά δυνατή τη διατύπωση κάποιων πρώτων υποθέσεων ή τη σκιαγράφηση προμπαμπιλιστικών μοντέλων, που στη συνέχεια δοκιμάζονται με την επιβεβαιωτική ανάλυση, επιστρέφοντας κατόπιν ξανά στις κλασικές μαθηματικές τεχνικές της στατιστικής. Από την άλλη πλευρά, η ανάλυση δεδομένων γαλλικού τύπου παρουσιάζεται ως αυτοσκοπός, ωθώντας στην πλήρη απόρριψη οποιουδήποτε προμπαμπιλιστικού μοντέλου. Η ανάλυση δεδομένων γαλλικού τύπου είναι, πάνω από όλα, μια περιγραφική τεχνική. Δεν έχει σκοπό να επιβεβαιώσει ή να απορρίψει κάποια πρότερα διατυπωμένη θεωρία. Από αυτήν την άποψη, συνδέεται με την παλαιά παράδοση των κοινωνιολόγων και των ιστορικών οικονομολόγων του 19ου αιώνα, οι οποίοι έχτισαν τους «γενικούς» τους νόμους μέσα από την παρατήρηση των δεδομένων. 

Βάσει πινάκων συνάφειας, που κατανέμουν τα υποκείμενα σύμφωνα με διάφορες ταξινομήσεις, η ανάλυση αντιστοιχιών ευθυγραμμίζεται με τη συμβατική αντίληψη, που προκύπτει από τις πολιτικές επιστήμες και το δίκαιο. Κατανέμει τις ταξινομήσεις σύμφωνα με ένα σύστημα εγγύτητας, σε σχηματισμούς ιδιοτήτων που γειτνιάζουν. Σε αυτήν την περίπτωση, οι ηθοποιοί που ανεβαίνουν στη σκηνή, στο θέατρο αυτό, είναι ομάδες (ή ακόμα και υποκείμενα), όχι όμως πια μεταβλητές. Τα υποκείμενα των ρημάτων είναι, στις προτάσεις των ερμηνειών, αυτές ακριβώς οι ομάδες (οι οποίες μπορούν να οριστούν με βάση το φύλο, την ηλικία, την ΚΕΚ κλπ.). Αυτά τα υποκείμενα έχουν μια αυτόνομη ύπαρξη σε σχέση με την εξαντλητική ορολογία (σε αντίθεση με τις μεθόδους λογιστικής παλινδρόμησης). Αυτές οι μέθοδοι μπορούν να χρησιμοποιηθούν με τρόπο ταξινομητικό a posteriori, ομαδοποιώντας (από το μικρότερο προς το μεγαλύτερο) υποκείμενα, ή κόβοντας (από το μεγαλύτερο προς το μικρότερο) το αρχικό σύνολο, μετά τον προσδιορισμό μιας «απόστασης», ελαχιστοποιώντας τις εσωτερικές ταξινομήσεις και μεγιστοποιώντας τις αποστάσεις μεταξύ των ταξινομήσεων. Σε αυτή την περίπτωση, η στατιστική ανάλυση δημιουργεί κυριολεκτικά νέους τύπους συμβατικών ισοδυναμιών, που μπορούν να επαναχρησιμοποιηθούν για δράση και που δεν έχουν άλλη εφαρμογή πέρα από τη χρήση που τους γίνεται. 

Όμως, η ανάλυση αντιστοιχιών, στην ευρέως χρησιμοποιούμενη «χαρτογραφική» της εκδοχή, η οποία τόσο έχει χρησιμοποιηθεί, επιστρέφει ξανά στη μετρολογική οπτική και τις λανθάνουσες μεταβλητές. Οι «άξονες αδράνειας», που καθορίζονται από τη διαγωνιοποίηση των πινάκων διακύμανσης συνδιακύμανσης, δημιουργούν ένα νέο χώρο, μέσα στον οποίο τόσο τα υποκείμενα, όσο και οι ομάδες διαθέτουν τα δικά τους «στοιχεία αναφοράς». Είναι δελεαστικό να ερμηνεύσουμε τα στοιχεία αυτά, να τα αντιμετωπίσουμε δηλαδή ως συνεχή μέτρα «κάποιου πράγματος» ως εάν υπήρχαν στη φύση -έστω κι αν δεν είναι άμεσα ορατά. Ορισμένες ερμηνείες του Benzécri, συνδέουν ορισμένες φορές τη δομή των αξόνων με κάποιο θεϊκό σχέδιο, θυμίζοντας αναντίρρητα τον Quetelet, για τον οποίο ο μέσος άνθρωπος δεν μπορούσε παρά να είναι προϊόν της θεϊκής βούλησης. Είτε πρόκειται απλώς για τη φύση, είτε για τον Θεό, μια ρεαλιστική στατιστική μπορεί πάντα να συμβάλλει στη δημιουργία της πραγματικότητας και μόνο μέσα από την αποτελεσματικότητα των διαδικασιών υπολογισμού και αντικειμενοποίησης. 

(Εφαρμογή της ανάλυσης αντιστοιχιών στα δεδομένα του Les structures sociales de l'économie, Paris, Seuil, coll. "Points", 2000, σ. 68 - Επεξεργασία: Δ. Λ.)

Έτσι, η λογιστική παλινδρόμηση και η ανάλυση αντιστοιχιών επιτυγχάνουν, με τον δικό τους τρόπο η καθεμιά, έναν υβριδισμό μεταξύ μετρολογικών και ταξινομητικών προοπτικών. Αποτελούν δύο από τις στατιστικές εκείνες μεθόδους που χρησιμοποιούνται περισσότερο από τους κοινωνιολόγους σήμερα. Ωστόσο, δεν μπορούμε να τις συγκρίνουμε καθώς η γλώσσα και οι χρήση τους είναι εντελώς διαφορετικές [6]. Χρησιμοποιούνται, πάνω από όλα, από κοινωνιολόγους σε πολύ διαφορετικά θεσμικά πλαίσια, γεγονός που καθιστά δύσκολη την κοινωνιολογική αντιπαράθεση μεταξύ των διαφορών στη χρήση τους. Τα παράγωγα της λογιστικής παλινδρόμησης παρουσιάζονται ως αποτελέσματα, ακριβώς γιατί συσχετίζουν  αιτίες με αποτελέσματα, χρησιμοποιώντας μεταβλητές έξω από το πλαίσιό τους, μεταβλητές που θεωρούνται γενικής εμβέλειας, κατά ανάλογο τρόπο με αυτόν των πειραματικών επιστημών που ξεδιπλώνουν σε στάδια την έρευνά τους (Licoppe, 1996). Από αυτή την άποψη, φαίνεται ότι βρίσκονται στον πυρήνα της επιστημονικής προσέγγισης μιας κοινωνιολογίας που προοδεύει τόσο, όσο περισσότερο σωρεύει αποτελέσματα τέτοιου είδους.

Από την άλλη πλευρά, στην ανάλυση δεδομένων γαλλικού τύπου (σε  ​​αντίθεση με την αγγλική data analysis) σπάνια τίθεται ως προϋπόθεση μια επιβεβαιωτική ανάλυση, προκειμένου να επαληθευθούν θεωρητικές υποθέσεις, οι οποίες χρησιμεύουν ως πηγή. Πρόκειται, μάλλον, για μέρος ενός ευρύτερου συνόλου ιστορικών περιγραφών της πολυπλοκότητας και των διαφορετικών διαστάσεων του κοινωνικού σύμπαντος. Οι μεταβλητές δεν εμφανίζονται ως τέτοιες, παρά δια μέσου των ταξινομήσεων που ορίζουν. Αυτές ακριβώς οι μοναδικές διαμορφώσεις των ταξινομήσεων και των ιδιοτήτων τους αποτελούν αντικείμενο σχολιασμού από τους κοινωνιολόγους. Η πιθανή γενίκευση προέρχεται από μια ρητορική διαφορετική από εκείνη των βιοεπιστημών ή των φυσικών επιστημών. Η επιχειρηματολογία συγκροτείται μέσα από την παράθεση παρόμοιων διαμορφώσεων. Έτσι, η δυσδιάστατη δομή του χώρου των γαλλικών κοινωνικών κατηγοριών προτάθηκε και επιβεβαιώθηκε από μια σειρά έργων που αναλύουν τη συμπεριφορά αυτών των κατηγοριών μέσα από διαφορετικές οπτικές γωνίες: μέσα από τη δομή της κατανάλωσης, τις πολιτιστικές πρακτικές, τη χωρική κατανομή των αστικών γειτονιών, τους διαφυλετικούς γάμους, την εκλογική συμπεριφορά (Desrosières, Thévenot, 2002). Αυτές οι διαμορφώσεις είναι ιστορικές διότι εξαρτώνται από ταξινομικές κατηγορίες, λίγο έως πολύ κλειστές όντας οι ίδιες ιστορικές, και από πρακτικές των οποίων το νόημα εξελίσσεται. […]

Σημειώσεις:

[**] Η Γαλλική Στατιστική Αρχή.

[***] Pierre Bourdieu, Η Διάκριση, Πατάκης, Αθήνα, 2002

[6] Για μια πραγμάτευση των διαφορών αυτών Félicité Hay des Nétumières (1996).