Εμφάνιση αναρτήσεων με ετικέτα Μεθοδολογία. Εμφάνιση όλων των αναρτήσεων
Εμφάνιση αναρτήσεων με ετικέτα Μεθοδολογία. Εμφάνιση όλων των αναρτήσεων

Παρασκευή 15 Νοεμβρίου 2024

Η ψηφιακή έρευνα μέσα από παραδείγματα

 

Το βιβλίο αυτό αποτελεί εισαγωγή στις ψηφιακές μεθόδους έρευνας για σπουδαστές κοινωνικών επιστημών και πληροφορικής που ενδιαφέρονται τόσο για την ποσοτική όσο και την ποιοτική μεθοδολογία έρευνας. Ταυτόχρονα, μέσα από παραδείγματα εστιάζει στα πλεονεκτήματα και τα μειονεκτήματα της κάθε μεθόδου προκρίνοντας τον αναστοχασμό πάνω στη χρήση των ψηφιακών εργαλείων έρευνας.

(Catherine Dawson, Το Α και το Ω των ψηφιακών μεθόδων έρευνας, Πεδίο, Αθήνα, 2022)

Παρασκευή 5 Ιανουαρίου 2024

Στα παρασκήνια της ερευνητικής διαδικασίας: η σημασία της πιλοτικής έρευνας

Η πιλοτική έρευνα [1] αποτελεί μια μικρής κλίμακας δοκιμαστική έρευνα, που πραγματοποιείται στο πλαίσιο προετοιμασίας για την τελική έρευνα. Η διενέργεια πιλοτικής έρευνας, κατά τα πρώτα στάδια μιας ερευνητικής προσπάθειας, αποτελεί καθοριστικό βήμα για την επιτυχή ολοκλήρωση αυτής της προσπάθειας. Οι λόγοι για κάτι τέτοιο πολλοί: η πιλοτική έρευνα βοηθά τους ερευνητές και τις ερευνήτριες να βελτιώσουν το σχεδιασμό της έρευνάς τους, να καθορίσουν το κατάλληλο μέγεθος δείγματος, να διαμορφώσουν κατάλληλα τις ερωτήσεις τους, να εντοπίσουν τις αδυναμίες της μεθοδολογίας ή να εντοπίσουν τεχνικά προβλήματα που μπορεί να ανακύψουν, επιτρέποντάς τους την ίδια στιγμή να εκτιμήσουν το κόστος, σε χρόνο και χρήμα, του όλου εγχειρήματος.

Τα παρακάτω στοιχεία προέρχονται από μια πιλοτική ποσοτική έρευνα που διεξήχθη στα τέλη του 2019 σε δείγμα 79 εργαζόμενων και μέλη σωματείων στον κλάδο των τηλεπικοινωνιών. Σκοπός της έρευνας, η διερεύνηση της στάσης των εργαζόμενων απέναντι στη συνδικαλιστική δράση των σωματείων του κλάδου. Κατά το πρώτο στάδιο διεξαγωγής αυτής της έρευνας κρίθηκε απαραίτητη η πραγματοποίηση μιας πιλοτικής με σκοπό να βοηθήσει τόσο στον έλεγχο της εγκυρότητας (reliability) και της αξιοπιστίας (validity) του ερωτηματολογίου [2], όσο και στην τελική του διαμόρφωση -μέσα από τον τρόπο με τον οποίο αποκρίνονταν οι ερωτώμενοι στις ερωτήσεις.

Η πιλοτική αυτή έρευνα πέτυχε να αναδείξει τις αδυναμίες του αρχικού σύντομου ερωτηματολογίου. Καθοριστική όμως υπήρξε η συμβολή της και σε κάτι επιπλέον: στη ριζική αναμόρφωση του ερωτηματολογίου μέσα από τις απαντήσεις που καταγράφηκαν σε μια παραγκωνισμένη ερώτηση στο αρχικό ερωτηματολόγιο (ερώτηση κατάταξης, classification) πάνω στις διεκδικήσεις, που το ερχόμενο χρονικό διάστημα όφειλαν να θέσουν κατά προτεραιότητα τα σωματεία του κλάδου. 
 
- Ποια αιτήματα πρέπει να παλέψουν τα σωματεία το ερχόμενο διάστημα; 
 
Επιλέξτε κατά σειρά προτεραιότητας:
- Αυξήσεις μισθών
- Μείωση χρόνου εργασίας
- Υπεράσπιση θέσεων εργασίας ενάντια σε απολύσεις
- Βελτίωση συνθηκών εργασίας
- Σταθερή δουλειά

Η ανάδειξη θεμάτων όπως η βελτίωση των συνθηκών εργασίας (1η επιλογή 38.7%) ή η υπεράσπιση των θέσεων εργασίας (2η επιλογή 30.6%) έναντι αιτημάτων όπως οι αυξήσεις μισθών ή η μείωση του χρόνου εργασίας (βλ. το παραπάνω γράφημα) βοήθησε στην αναδιαμόρφωση και την προσθήκη νέων ερωτήσεων του κλειστού τύπου ερωτηματολογίου, όσο και στη συμπλήρωσή του μέσα από τη διενέργεια συνεντεύξεων με μέλη σωματείων του κλάδου. 
 
Παρόλα αυτά, οι πιλοτικές έρευνες δεν πρέπει να χρησιμοποιούνται ούτε για την εξαγωγή συμπερασμάτων ούτε στον έλεγχο υποθέσεων. Επιτυχημένες είναι όταν φέρνουν στην επιφάνεια αδυναμίες ή μη αναμενόμενα αποτελέσματα των μεθόδων που τίθενται σε εφαρμογή. Αντίθετα, η αγνόηση των θεμάτων που φωτίζουν μπορεί να θέσει σε κίνδυνο ακόμα και την ακεραιότητα του όλου ερευνητικού εγχειρήματος. 


Σημειώσεις: 

[1] Smith, C.A. (2019), "The Uses of Pilot Studies in Sociology", The American Sociologist, 50, 589–607 https://doi.org/10.1007/s12108-019-09419-y

[2] Αξιοπιστία: σταθερότητα αποτελεσμάτων μέτρησης σε επαναλαμβανόμενες μετρήσεις. Εγκυρότητα: επιτυχής μέτρηση του επιδιωκόμενου.

Παρασκευή 13 Οκτωβρίου 2023

Ανάλυση Κοινωνικών Δικτύων: πρακτικός οδηγός με τη χρήση της γλώσσας R

Η Ανάλυση Κοινωνικών Δικτύων (ΑΚΔ) στις κοινωνικές επιστήμες αποτελεί μια τεχνική μελέτης της δομής των σχέσεων που συνέχουν άτομα, κοινωνικές ομάδες, φορείς, οργανισμούς, οντότητες. Παρέχει ένα πλαίσιο για την κατανόηση των δεσμών αλληλεξάρτησης που δημιουργούνται μεταξύ των παραπάνω, όσο και τη δράση τους μέσα στις κοινωνικές σχέσεις. Οι θεωρητικές πτυχές της ΑΚΔ περιλαμβάνουν βασικές έννοιες όπως αυτή των κόμβων (nodes) και των ακμών ή συνδέσμων (edges ή ties). Ας δούμε, εν τάχει, ένα απλό παράδειγμα ανάλυσης ενός μικρού φιλικού δικτύου πέντε ατόμων, αφού πρώτα αναφερθούμε στις έννοιες-κλειδιά αυτής της τεχνικής. 
 
  • Οι κόμβοι στην ανάλυση κοινωνικών δικτύων αντιπροσωπεύουν μεμονωμένες οντότητες, φορείς, ομάδες ή άτομα. (Στο παράδειγμα που θα δούμε παρακάτω οι κόμβοι επισημαίνονται ως "Άτομο 1", "Άτομο 2" και ούτω καθεξής).
  • Οι ακμές ή σύνδεσμοι αντιπροσωπεύουν τις σχέσεις ή τις αλληλεπιδράσεις μεταξύ των κόμβων του δικτύου.
Για την απεικόνιση των δικτύων χρησιμοποιούνται γράφοι και δυαδικοί πίνακες με γραμμές και στήλες ίσες με τους κόμβους του δικτύου. Επίσης, κεντρικής σημασίας στην ανάλυση δικτύων είναι τα μέτρα κεντρικότητας (Centrality Measures), όπως η Κεντρικότητα Βαθμού (Degree Centrality, ποσοτικός προσδιορισμός της σημασίας ενός κόμβου με βάση τις συνδέσεις του), η Διαμεσότητα (Betweenness Centrality, μέτρηση κόμβων που λειτουργούν ως γέφυρες ή σημεία ένωσης μεταξύ των κόμβων) και η Κεντρικότητα Εγγύτητας (Closeness Centrality, μέτρηση της προσβασιμότητας ενός κόμβου εντός του δικτύου, πόσο μακριά για παράδειγμα βρίσκεται ο ένας από τον άλλο κόμβο). Άλλες θεωρητικές πτυχές της ΑΚΔ περιλαμβάνουν την ανίχνευση κοινοτήτων (την αναγνώριση δηλαδή στενά συνδεδεμένων κόμβων), καθώς και τη μελέτη της δυναμικής εξέλιξης του δικτύου στο χρόνο. 
 
Ας επικεντρωθούμε τώρα στο παράδειγμα ενός φιλικού δικτύου πέντε ατόμων:
 
Πώς οι σχέσεις μεταξύ των πέντε αυτών φίλων επηρεάζουν την ανταλλαγή πληροφοριών μέσα στην ομάδα; Ποια άτομα έχουν τη μεγαλύτερη επιρροή εντός της και πώς οι αλληλεπιδράσεις τους αντανακλώνται στη συνοχή της ομάδας αυτής; 
 
Προκειμένου να κατανοήσουμε τις σχέσεις εντός αυτού του φιλικού δικτύου απαραίτητη είναι η καταγραφή των σχέσεων μεταξύ των πέντε φίλων σε έναν δυαδικό πίνακα με τη μορφή μιας μήτρας γειτνιάσεων (adjacency matrix) όπως παρακάτω. (Ο υπολογισμός των στατιστικών της ανάλυσης που παρουσιάζονται παρακάτω έγινε με τη βοήθεια της βιβλιοθήκης igraph για τη γλώσσα R. O κώδικας έχει δημοσιευτεί εδώ):
 
Άτομο 1Άτομο 2Άτομο 3Άτομο 4Άτομο 5
01010
10110
01011
11101
00110
 
Η τιμή 1 στον πίνακα υποδηλώνει την ύπαρξη σχέσης (ύπαρξη άμεσης εδώ φιλίας) μεταξύ των ατόμων, ενώ η τιμή 0 την απουσία της. Απεικονίζοντας τώρα, τον παραπάνω πίνακα αποκαλύπτονται οι πέντε φίλοι ως κόμβοι (κύκλοι) μαζί με τους δεσμούς φιλίας που τους συνέχουν, οι ακμές του δικτύου σε μορφή γραμμών.
 
 
Μπορούμε να δούμε ότι τα άτομα 1 και 4 έχουν κοινό φίλο το άτομο 2, τα 1 και 2 το άτομο 4, τα 2 και 4 το άτομο 1 κ.ο.κ. Ας προσέξουμε εδώ όμως, πως το άτομο 1 γνωρίζει τα άτομα 3 και 5, έμμεσα, μόνο μέσω άλλων ατόμων, όπως αντίστοιχα και το άτομο 5 το άτομο 1. Στο κέντρο του δικτύου βρίσκεται το άτομο 4, το οποίο είναι και αυτό με τις περισσότερες άμεσες φιλίες: οι περισσότεροι κόμβοι του δικτυού συνδέονται μαζί του με άμεσο τρόπο γεγονός που υποδηλώνει και το σημαντικό βαθμό επιρροής που ασκεί στα υπόλοιπα άτομα -απαντώντας και στο αρχικό ερώτημα. Αντίθετα, στην άκρη του δικτύου βρίσκονται τα άτομα 1 και 5, τα οποία έχουν τους λιγότερους κοινούς φίλους σε σχέση με τα υπόλοιπα άτομα.   
 
Centrality Measures
 
Degree: 2 3 3 4 2

Clustering Coefficient: 0.64 
 
Diameter: 2
 
Ο υπολογισμός μέτρων κεντρικότητας του δικτύου επιβεβαιώνει όσα αποκαλύπτει το γράφημα το οποίο είδαμε, προσφέροντας επιπλέον ορισμένες πληροφορίες για τη δομή αυτού του δικτύου. Η Κεντρικότητα Βαθμού, Degree, (2 για το άτομο 1, 3 για το άτομο 2, 3 για το άτομο 3, 4 για το άτομο 4 και 2 για το άτομο 5) δείχνει ότι τα άτομα 2, 3 και 4 έχουν περισσότερες συνδέσεις από τα άτομα 1 και 5. Ο συντελεστής ομαδοποίησης (Clustering Coefficient) που παίρνει τιμές από το 0 έως το 1, δείχνει ότι το δίκτυο έχει υψηλό βαθμό ομαδοποίησης και συνοχής. Πρακτικά αυτό σημαίνει πως φίλοι/ες ενός ατόμου δυνητικά μπορεί να είναι (ή να γίνουν) φίλοι/ες με άλλα άτομα μέσα από το δίκτυο. Τέλος, Διάμετρος 2 σημαίνει πως η πιο σύντομη διαδρομή μεταξύ δύο ατόμων στο δίκτυο είναι 2. Με άλλα λόγια, στην παρούσα ομάδα φίλων ένα άτομο μπορεί να προσεγγίσει οποιοδήποτε άλλο άτομο μέσα από το πολύ δύο σχέσεις φιλίας. 
 
Εν κατακλείδι, σε ένα δίκτυο όπως αυτό, όπου ένα άτομο, το Άτομο 4, έχει περισσότερες άμεσες συνδέσεις, οι πληροφορίες ρέουν πιο εύκολα μέσω αυτού προτού αγγίξουν κάθε κόμβο. Αν και η ύπαρξη υποομάδων είναι αυτή που μπορεί δυνητικά να επηρεάσει την ανταλλαγή πληροφοριών μέσα σε μια ομάδα, στην περίπτωση αυτή κάτι τέτοιο δε συμβαίνει, όπως προκύπτει από τη μικρή διάμετρο του δικτύου.  

Παρασκευή 15 Σεπτεμβρίου 2023

O Benzécri και η γαλλική σχολή ανάλυσης δεδομένων (1960-1990)


Jean-Paul Benzécri, 1932–2019
 
Ο Jean-Paul Benzécri, μαθηματικός και στατιστικολόγος που συνέβαλε καθοριστικά στον τομέα της πολυμεταβλητής στατιστικής ανάλυσης, θεωρείται ο ιδρυτής της γαλλικής σχολής ανάλυσης δεδομένων [1]. Έγινε ιδιαίτερα γνωστός στη Γαλλία κατά τη δεκαετία του 1960 για τις εργασίες του πάνω στην Παραγοντική Ανάλυση Αντιστοιχιών (Analyse Factorielle des Correspondances), μια τεχνική που χρησιμοποιείται στην ανάλυση ποσοτικών δεδομένων.

Ο Benzécri γεννήθηκε στην Τουλούζ της Γαλλίας το 1932 και σπούδασε στην École Normale Supérieure στο Παρίσι (1950). To 1955 έλαβε τη διδακτορική του διατριβή από το Πανεπιστήμιο του Πρίνστον υπό την επίβλεψη του Henri Cartan -γνωστό για τις εργασίες του πάνω στην αλγεβρική τοπολογία. Όταν το 1965 εκλέγεται καθηγητής στη Σορβόννη ιδρύει το Laboratoire de Statistique, εντός του Ινστιτούτου Στατιστικής του Παρισιού, όπου παραδίδει μαθήματα πάνω στην ανάλυση δεδομένων (analyse des données). Εκεί αναπτύσσει περαιτέρω τις εργασίες του πάνω στην Παραγοντική Ανάλυση Αντιστοιχιών, μέθοδο που καθιστά δυνατή την επεξεργασία κατηγορικών δεδομένων μέσα από την οπτικοποίηση και ιεράρχηση των πληροφοριών που αυτά παρέχουν.
 
 
(Πολλαπλή Ανάλυση Αντιστοιχιών | Libraries: FactoMineR, ggplot2, plotly | dataset: poison) [*]


Συνοπτικά, η Ανάλυση Αντιστοιχιών (CA) αποτελεί στατιστική μέθοδο που χρησιμοποιείται για τη διερεύνηση των σχέσεων μεταξύ κατηγορικών μεταβλητών σε έναν δισδιάστατο χώρο. Η ισχύς της μεθόδου, και κυρίως της Πολλαπλής Ανάλυσης Αντιστοιχιών (MCA) που αποτελεί γενίκευσή της, έγκειται στον εντοπισμό επαναλαμβανόμενων μοτίβων μέσα από τη μείωση της πολυπλοκότητας πολυδιάστατων δεδομένων. Η τεχνική αυτή, φέρνει παράλληλα στο φως μη φανερές συσχετίσεις μεταξύ πολλών διαφορετικών μεταβλητών. Για το λόγο αυτό τα ευρήματά της είναι πολύτιμα στη λήψη αποφάσεων και πλέον έχουν ευρύ φάσμα εφαρμογών από τη βιολογία έως τις κοινωνικές επιστήμες. Στην κοινωνιολογία, η χρήση της μεθόδου από τον Pierre Bourdieu (1930-2002) υπήρξε καθοριστική στη μελέτη της κατανομής του πολιτισμικού κεφαλαίου της γαλλικής κοινωνίας του καιρού του. (Βλ. πιο αναλυτικά εδώ).

Σημειώσεις:


[1] Βλ. σχετικά εδώ κι εδώ

[*] Το διαδραστικό διάγραμμα διασποράς (η γραφική παράσταση MCA) βασίζεται στα δεδομένα μιας έρευνας (περιλαμβάνεται στη βιβλιοθήκη FactoMineR του François Husson στη γλώσσα R) που πραγματοποιήθηκε σε παιδιά που υπέφεραν από τροφική δηλητηρίαση (dataset: poison). Στο παράδειγμα, κάθε σημείο της γραφικής παράστασης αντιπροσωπεύει μια παρατήρηση. Η θέση των σημείων καθορίζεται από τις δύο πρώτες διαστάσεις (Dim.1 και Dim.2) των αποτελεσμάτων της MCA και αφορά τον τρόπο με τον οποίο τα παιδιά αυτά σχετίζονται με τα συμπτώματα που παρουσίασαν με βάση το φύλο τους (Male/Female). Η διασπορά των σημείων στο γράφημα παρέχει πληροφορίες σχετικά με το πόσο διακριτά ή παρόμοια είναι τα συμπτώματα τροφικής δηλητηρίασης (ναυτία, εμετός, διάρροια, πυρετός κτλ.) που ανέφεραν παιδιά διαφορετικού φύλου σε σχέση με ό,τι δήλωσαν πως έφαγαν (ψάρι, μαγιονέζα, τυρί, παγωτό κτλ.). Εν συντομία, αλληλεπικάλυψη (ή γειντίαση) των σημείων υποδηλώνει ομοιότητα συμπτωμάτων, ενώ απόσταση των σημείων υποδηλώνει διαφοροποίηση συγκριτικά με το φύλο και ό,τι δήλωσαν πως κατανάλωσαν. Τέλος, η αριστερή πλευρά του γραφήματος (άξονας με τις αρνητικές τιμές) ομαδοποιεί όσες/ους τελικά νόσησαν, ενώ η δεξιά (άξονας με θετικές τιμές) όσους/ες δε νόσησαν. 

Παρασκευή 5 Μαΐου 2023

Διαδικτυακό σεμινάριο στην ποσοτική ανάλυση με τη χρήση των SPSS και R για αρχάριους: εγγραφείτε τώρα


ΣΕΙΡΑ 1

Περιεχόμενα:
 

1. Μάθετε πώς να χρησιμοποιείτε το SPSS και τη γλώσσα R στην ποσοτική ανάλυση.

2. Παραδείγματα προετοιμασίας δεδομένων με τη χρήση των δυο προγραμμάτων λογισμικού.

3. Περιγραφική στατιστική, διερευνητική ανάλυση δεδομένων, μέτρα κεντρικής τάσης, διασποράς και ανάλυση συσχέτισης.

4. Μελέτες περίπτωσης (case studies) με τη χρήση ποσοτικών μεθόδων στην ανάλυση οικονομικών στάσεων.
 
Δεν απαιτείται πρότερη γνώση του SPSS ή της γλώσσας R.

Λεπτομέρειες:

- Ημερομηνία: 5/5
- Ώρα: 20:30 - 21:30
- Διάρκεια: 120 λεπτά
- Παρουσίαση: Γιώργος Ευαγγέλου & Δημήτρης Λάζαρης 
 
Συνδεθείτε στο zoom κάνωντας κλικ
  

Παρασκευή 2 Δεκεμβρίου 2022

Aνάλυση δεδομένων μέσα από εφαρμογές


Το βιβλίο αυτό αφορά την ανάλυση δεδομένων (data analysis) και δίνει έμφαση στην πρακτική της προβλεπτικής μοντελοποίησης (predictive modeling). Ο όρος προβλεπτική μοντελοποίηση μπορεί να προκαλεί συνειρμούς με τη μηχανική εκμάθηση (machine learning), την αναγνώριση μοτίβων (pattern recognition) και την εξόρυξη δεδομένων (data mining). Μπορεί οι συνειρμοί αυτοί να είναι σωστοί και οι μέθοδοι που υπονοούνται από αυτούς τους όρους να αποτελούν αναπόσπαστο κομμάτι της διαδικασίας της προβλεπτικής μοντελοποίησης, παρόλα αυτά η προβλεπτική μοντελοποίηση περιλαμβάνει πολλά περισσότερα πράγματα από εργαλεία και τεχνικές αποκάλυψης μοτίβων στα δεδομένων. Η πρακτική της προβλεπτικής μοντελοποίησης ορίζει τη διαδικασία ανάπτυξης ενός μοντέλου κατά τρόπο τέτοιο ώστε να είναι εφικτή η κατανόηση και η ποσοτικοποίηση της ακρίβειας μιας πρόβλεψης πάνω σε μελλοντικά δεδομένα που δεν είναι ακόμα γνωστά. Το σύνολο της διαδικασίας αυτής βρίσκεται στο επίκεντρο αυτού του βιβλίου*.

(Max Kuhn and Kjell Johnson, Applied Predictive Modeling [* Από την εισαγωγή, μτφρ. Δ. Λ.])

Δευτέρα 28 Μαρτίου 2022

Η γαλλική οδός στην ανάλυση δεδομένων: 2. Η παραγοντική ανάλυση των αντιστοιχιών

Το παρακάτω απόσπασμα, το δεύτερο μέρος του οποίου δημοσιεύεται παρακάτω (για το πρώτο μέρος βλ. εδώ), προέρχεται από το 9ο κεφάλαιο του βιβλίου του Alain Desrosières, Pour une sociologie historique de la quantification, Παρίσι, Presses des Mines, 2008 εστιάζει στη γαλλική σχολή ανάλυσης δεδομένων στις κοινωνικές επιστήμες. [Η επιλογή του αποσπάσματος, η μετάφραση, καθώς και οι υποσημειώσεις με αστερίσκο είναι δικές μου - Δ. Λ.].  

ΙΙ. Ανάλυση δεδομένων και data analysis

Η λεγόμενη ανάλυση δεδομένων "γαλλικού τύπου", όπως δηλαδή προκύπτει από το έργο των Jean-Paul Benzécri και Brigitte Escoffier, συνδυάζει ταξινομητικές και μετρολογικές πτυχές. Βρίσκεται, άλλωστε, σε άμεση σύνδεση με την «παραγοντική ανάλυση» των ψυχομετρών, οι οποίοι ακολούθησαν την τυπική προσέγγιση της «συμπτωματικής» μετρολογίας των βιοεπιστημών (Benzécri, 1982). Η γενική ευφυΐα (ή "παράγοντας g") του Charles Spearman (1904) ήταν μια λανθάνουσα μεταβλητή, που αναφερόταν στο μέσο όρο βαθμολογίας που συγκέντρωναν p μαθητές μέσα από n σχολικά τεστ. Η μεταβλητή αυτή οριζόταν ως ο κύριος άξονας της αδράνειας του νέφους p σημείων που αντιπροσώπευαν την απόδοση των μαθητών σε έναν n-διαστατο χώρο δοκιμών. Η μονοδιάστατη φύση αυτού του νέφους συζητήθηκε και επικρίθηκε αρχικά από τον Burt και στη συνέχεια από τον Thurstone, οι οποίοι επιδιώκοντας να εξερευνήσουν ορθογώνιους άξονες, περιέγραψαν με μεγαλύτερη ακρίβεια την πολυπλοκότητα του χώρου των δεξιοτήτων. Χωρίς να χρησιμοποιούν υπολογιστές, οι ψυχομέτρες απέκτησαν μεγάλη επιδεξιότητα στο να θέτουν σε εφαρμογή την τεχνική της "περιστροφής των αξόνων" σε χώρους πολλών διαστάσεων. Αυτή η τεχνική, που χρησιμοποιήθηκε κυρίως από ψυχολόγους, ήταν ελάχιστα γνωστή στους κοινωνιολόγους στη Γαλλία, τουλάχιστον μέχρι τη δεκαετία του 1960.

Έτσι όμως, μια τόσο σημαντική εμπειρία παρέμενε απομονωμένη και χωρίς συνέχεια. Το 1954, ο Jean Porte, ο δημιουργός των κοινωνικο-επαγγελματικών κατηγοριών (ΚΕΚ), πραγματοποίησε στο INSEE [**] μια «δειγματοληπτική έρευνα για τους ακροατές του ραδιοφώνου», τον πρόγονο της κατηγορίας του κοινού. Χρησιμοποιώντας την «παραγοντική ανάλυση των προτιμήσεων», προεικονίζοντας, είκοσι-πέντε χρόνια νωρίτερα, τη Διάκριση του Bourdieu [***], ο Jean Porte πραγματοποίησε παραγοντική ανάλυση σε έναν πίνακα συσχετίσεων που περιείχε τις προτιμήσεις των ακροατών για διάφορα είδη ραδιοφωνικών προγραμμάτων. Για να πετύχει κάτι τέτοιο, χρησιμοποίησε τη λεγόμενη «κεντροειδή» μέθοδο του Thurstone: «Ένα τέτοιο εγχείρημα μπορεί δύσκολα να δικαιολογηθεί παρά μόνο αν το αποτέλεσμα στεφθεί με επιτυχία, δηλαδή αν παρέχει δυνατότητες ερμηνείας του αποτελέσματος» (Porte, 1954, σελ. 53). Ο Porte αφού πρώτα ερμήνευσε τον πρώτο παράγοντα, μέσα από την αντίθεση μεταξύ «ποιοτικών ραδιοφωνικών εκπομπών» και «ελαφρών ραδιοφωνικών εκπομπών», στη συνέχεια προχώρησε, μέσω μιας επιδέξιας περιστροφής των αξόνων (την οποία αναπαράστησε γραφιστικά), στο δεύτερο παράγοντα, ο οποίος αντιπαρέβαλε τις «μουσικές ραδιοφωνικές εκπομπές» με τις «εκπομπές συζήτησης». Ωστόσο, η ανάλυσή του αφορoύσε περισσότερο την εγγύτητα μεταξύ των ραδιοφωνικών εκπομπών και λιγότερο τη συσχέτιση μεταξύ των προτιμήσεων και των διαφορετικών ΚΕΚ (που αναλύθηκαν με πιο παραδοσιακές [στατιστικές] μεθόδους), ενώ ειδικά η παραγοντική ανάλυση δε θα τον οδηγήσει, τότε ακόμα, σε κάποια χαρτογράφηση, χαρακτηριστικό αργότερα της ανάλυσης αντιστοιχιών.

Παρά την ταύτιση όσον αφορά την ονομασία, η φιλοσοφία των γαλλικών μεθόδων ανάλυσης δεδομένων και των αγγλοσαξονικών data analysis, οι οποίες διαδόθηκαν από τους John Tukey και Eugène Horber, δεν είναι η ίδια (Deville and Malinvaud, 1983; Horber, 1990; Schiltz, 1991). Οι αγγλοσαξονικές μέθοδοι διακρίνουν με σαφήνεια την εξερευνητική ανάλυση, η οποία μέσα από μεθόδους εξέτασης και μια πολύ απλή απεικόνιση ενός αρχείου, καθιστά δυνατή τη διατύπωση κάποιων πρώτων υποθέσεων ή τη σκιαγράφηση προμπαμπιλιστικών μοντέλων, που στη συνέχεια δοκιμάζονται με την επιβεβαιωτική ανάλυση, επιστρέφοντας κατόπιν ξανά στις κλασικές μαθηματικές τεχνικές της στατιστικής. Από την άλλη πλευρά, η ανάλυση δεδομένων γαλλικού τύπου παρουσιάζεται ως αυτοσκοπός, ωθώντας στην πλήρη απόρριψη οποιουδήποτε προμπαμπιλιστικού μοντέλου. Η ανάλυση δεδομένων γαλλικού τύπου είναι, πάνω από όλα, μια περιγραφική τεχνική. Δεν έχει σκοπό να επιβεβαιώσει ή να απορρίψει κάποια πρότερα διατυπωμένη θεωρία. Από αυτήν την άποψη, συνδέεται με την παλαιά παράδοση των κοινωνιολόγων και των ιστορικών οικονομολόγων του 19ου αιώνα, οι οποίοι έχτισαν τους «γενικούς» τους νόμους μέσα από την παρατήρηση των δεδομένων. 

Βάσει πινάκων συνάφειας, που κατανέμουν τα υποκείμενα σύμφωνα με διάφορες ταξινομήσεις, η ανάλυση αντιστοιχιών ευθυγραμμίζεται με τη συμβατική αντίληψη, που προκύπτει από τις πολιτικές επιστήμες και το δίκαιο. Κατανέμει τις ταξινομήσεις σύμφωνα με ένα σύστημα εγγύτητας, σε σχηματισμούς ιδιοτήτων που γειτνιάζουν. Σε αυτήν την περίπτωση, οι ηθοποιοί που ανεβαίνουν στη σκηνή, στο θέατρο αυτό, είναι ομάδες (ή ακόμα και υποκείμενα), όχι όμως πια μεταβλητές. Τα υποκείμενα των ρημάτων είναι, στις προτάσεις των ερμηνειών, αυτές ακριβώς οι ομάδες (οι οποίες μπορούν να οριστούν με βάση το φύλο, την ηλικία, την ΚΕΚ κλπ.). Αυτά τα υποκείμενα έχουν μια αυτόνομη ύπαρξη σε σχέση με την εξαντλητική ορολογία (σε αντίθεση με τις μεθόδους λογιστικής παλινδρόμησης). Αυτές οι μέθοδοι μπορούν να χρησιμοποιηθούν με τρόπο ταξινομητικό a posteriori, ομαδοποιώντας (από το μικρότερο προς το μεγαλύτερο) υποκείμενα, ή κόβοντας (από το μεγαλύτερο προς το μικρότερο) το αρχικό σύνολο, μετά τον προσδιορισμό μιας «απόστασης», ελαχιστοποιώντας τις εσωτερικές ταξινομήσεις και μεγιστοποιώντας τις αποστάσεις μεταξύ των ταξινομήσεων. Σε αυτή την περίπτωση, η στατιστική ανάλυση δημιουργεί κυριολεκτικά νέους τύπους συμβατικών ισοδυναμιών, που μπορούν να επαναχρησιμοποιηθούν για δράση και που δεν έχουν άλλη εφαρμογή πέρα από τη χρήση που τους γίνεται. 

Όμως, η ανάλυση αντιστοιχιών, στην ευρέως χρησιμοποιούμενη «χαρτογραφική» της εκδοχή, η οποία τόσο έχει χρησιμοποιηθεί, επιστρέφει ξανά στη μετρολογική οπτική και τις λανθάνουσες μεταβλητές. Οι «άξονες αδράνειας», που καθορίζονται από τη διαγωνιοποίηση των πινάκων διακύμανσης συνδιακύμανσης, δημιουργούν ένα νέο χώρο, μέσα στον οποίο τόσο τα υποκείμενα, όσο και οι ομάδες διαθέτουν τα δικά τους «στοιχεία αναφοράς». Είναι δελεαστικό να ερμηνεύσουμε τα στοιχεία αυτά, να τα αντιμετωπίσουμε δηλαδή ως συνεχή μέτρα «κάποιου πράγματος» ως εάν υπήρχαν στη φύση -έστω κι αν δεν είναι άμεσα ορατά. Ορισμένες ερμηνείες του Benzécri, συνδέουν ορισμένες φορές τη δομή των αξόνων με κάποιο θεϊκό σχέδιο, θυμίζοντας αναντίρρητα τον Quetelet, για τον οποίο ο μέσος άνθρωπος δεν μπορούσε παρά να είναι προϊόν της θεϊκής βούλησης. Είτε πρόκειται απλώς για τη φύση, είτε για τον Θεό, μια ρεαλιστική στατιστική μπορεί πάντα να συμβάλλει στη δημιουργία της πραγματικότητας και μόνο μέσα από την αποτελεσματικότητα των διαδικασιών υπολογισμού και αντικειμενοποίησης. 

(Εφαρμογή της ανάλυσης αντιστοιχιών στα δεδομένα του Les structures sociales de l'économie, Paris, Seuil, coll. "Points", 2000, σ. 68 - Επεξεργασία: Δ. Λ.)

Έτσι, η λογιστική παλινδρόμηση και η ανάλυση αντιστοιχιών επιτυγχάνουν, με τον δικό τους τρόπο η καθεμιά, έναν υβριδισμό μεταξύ μετρολογικών και ταξινομητικών προοπτικών. Αποτελούν δύο από τις στατιστικές εκείνες μεθόδους που χρησιμοποιούνται περισσότερο από τους κοινωνιολόγους σήμερα. Ωστόσο, δεν μπορούμε να τις συγκρίνουμε καθώς η γλώσσα και οι χρήση τους είναι εντελώς διαφορετικές [6]. Χρησιμοποιούνται, πάνω από όλα, από κοινωνιολόγους σε πολύ διαφορετικά θεσμικά πλαίσια, γεγονός που καθιστά δύσκολη την κοινωνιολογική αντιπαράθεση μεταξύ των διαφορών στη χρήση τους. Τα παράγωγα της λογιστικής παλινδρόμησης παρουσιάζονται ως αποτελέσματα, ακριβώς γιατί συσχετίζουν  αιτίες με αποτελέσματα, χρησιμοποιώντας μεταβλητές έξω από το πλαίσιό τους, μεταβλητές που θεωρούνται γενικής εμβέλειας, κατά ανάλογο τρόπο με αυτόν των πειραματικών επιστημών που ξεδιπλώνουν σε στάδια την έρευνά τους (Licoppe, 1996). Από αυτή την άποψη, φαίνεται ότι βρίσκονται στον πυρήνα της επιστημονικής προσέγγισης μιας κοινωνιολογίας που προοδεύει τόσο, όσο περισσότερο σωρεύει αποτελέσματα τέτοιου είδους.

Από την άλλη πλευρά, στην ανάλυση δεδομένων γαλλικού τύπου (σε  ​​αντίθεση με την αγγλική data analysis) σπάνια τίθεται ως προϋπόθεση μια επιβεβαιωτική ανάλυση, προκειμένου να επαληθευθούν θεωρητικές υποθέσεις, οι οποίες χρησιμεύουν ως πηγή. Πρόκειται, μάλλον, για μέρος ενός ευρύτερου συνόλου ιστορικών περιγραφών της πολυπλοκότητας και των διαφορετικών διαστάσεων του κοινωνικού σύμπαντος. Οι μεταβλητές δεν εμφανίζονται ως τέτοιες, παρά δια μέσου των ταξινομήσεων που ορίζουν. Αυτές ακριβώς οι μοναδικές διαμορφώσεις των ταξινομήσεων και των ιδιοτήτων τους αποτελούν αντικείμενο σχολιασμού από τους κοινωνιολόγους. Η πιθανή γενίκευση προέρχεται από μια ρητορική διαφορετική από εκείνη των βιοεπιστημών ή των φυσικών επιστημών. Η επιχειρηματολογία συγκροτείται μέσα από την παράθεση παρόμοιων διαμορφώσεων. Έτσι, η δυσδιάστατη δομή του χώρου των γαλλικών κοινωνικών κατηγοριών προτάθηκε και επιβεβαιώθηκε από μια σειρά έργων που αναλύουν τη συμπεριφορά αυτών των κατηγοριών μέσα από διαφορετικές οπτικές γωνίες: μέσα από τη δομή της κατανάλωσης, τις πολιτιστικές πρακτικές, τη χωρική κατανομή των αστικών γειτονιών, τους διαφυλετικούς γάμους, την εκλογική συμπεριφορά (Desrosières, Thévenot, 2002). Αυτές οι διαμορφώσεις είναι ιστορικές διότι εξαρτώνται από ταξινομικές κατηγορίες, λίγο έως πολύ κλειστές όντας οι ίδιες ιστορικές, και από πρακτικές των οποίων το νόημα εξελίσσεται. […]

Σημειώσεις:

[**] Η Γαλλική Στατιστική Αρχή.

[***] Pierre Bourdieu, Η Διάκριση, Πατάκης, Αθήνα, 2002

[6] Για μια πραγμάτευση των διαφορών αυτών Félicité Hay des Nétumières (1996).