Εμφάνιση αναρτήσεων με ετικέτα Jean-Paul Benzécri. Εμφάνιση όλων των αναρτήσεων
Εμφάνιση αναρτήσεων με ετικέτα Jean-Paul Benzécri. Εμφάνιση όλων των αναρτήσεων

Παρασκευή 15 Σεπτεμβρίου 2023

O Benzécri και η γαλλική σχολή ανάλυσης δεδομένων (1960-1990)


Jean-Paul Benzécri, 1932–2019
 
Ο Jean-Paul Benzécri, μαθηματικός και στατιστικολόγος που συνέβαλε καθοριστικά στον τομέα της πολυμεταβλητής στατιστικής ανάλυσης, θεωρείται ο ιδρυτής της γαλλικής σχολής ανάλυσης δεδομένων [1]. Έγινε ιδιαίτερα γνωστός στη Γαλλία κατά τη δεκαετία του 1960 για τις εργασίες του πάνω στην Παραγοντική Ανάλυση Αντιστοιχιών (Analyse Factorielle des Correspondances), μια τεχνική που χρησιμοποιείται στην ανάλυση ποσοτικών δεδομένων.

Ο Benzécri γεννήθηκε στην Τουλούζ της Γαλλίας το 1932 και σπούδασε στην École Normale Supérieure στο Παρίσι (1950). To 1955 έλαβε τη διδακτορική του διατριβή από το Πανεπιστήμιο του Πρίνστον υπό την επίβλεψη του Henri Cartan -γνωστό για τις εργασίες του πάνω στην αλγεβρική τοπολογία. Όταν το 1965 εκλέγεται καθηγητής στη Σορβόννη ιδρύει το Laboratoire de Statistique, εντός του Ινστιτούτου Στατιστικής του Παρισιού, όπου παραδίδει μαθήματα πάνω στην ανάλυση δεδομένων (analyse des données). Εκεί αναπτύσσει περαιτέρω τις εργασίες του πάνω στην Παραγοντική Ανάλυση Αντιστοιχιών, μέθοδο που καθιστά δυνατή την επεξεργασία κατηγορικών δεδομένων μέσα από την οπτικοποίηση και ιεράρχηση των πληροφοριών που αυτά παρέχουν.
 
 
(Πολλαπλή Ανάλυση Αντιστοιχιών | Libraries: FactoMineR, ggplot2, plotly | dataset: poison) [*]


Συνοπτικά, η Ανάλυση Αντιστοιχιών (CA) αποτελεί στατιστική μέθοδο που χρησιμοποιείται για τη διερεύνηση των σχέσεων μεταξύ κατηγορικών μεταβλητών σε έναν δισδιάστατο χώρο. Η ισχύς της μεθόδου, και κυρίως της Πολλαπλής Ανάλυσης Αντιστοιχιών (MCA) που αποτελεί γενίκευσή της, έγκειται στον εντοπισμό επαναλαμβανόμενων μοτίβων μέσα από τη μείωση της πολυπλοκότητας πολυδιάστατων δεδομένων. Η τεχνική αυτή, φέρνει παράλληλα στο φως μη φανερές συσχετίσεις μεταξύ πολλών διαφορετικών μεταβλητών. Για το λόγο αυτό τα ευρήματά της είναι πολύτιμα στη λήψη αποφάσεων και πλέον έχουν ευρύ φάσμα εφαρμογών από τη βιολογία έως τις κοινωνικές επιστήμες. Στην κοινωνιολογία, η χρήση της μεθόδου από τον Pierre Bourdieu (1930-2002) υπήρξε καθοριστική στη μελέτη της κατανομής του πολιτισμικού κεφαλαίου της γαλλικής κοινωνίας του καιρού του. (Βλ. πιο αναλυτικά εδώ).

Δ.Λ.

Σημειώσεις:


[1] Βλ. σχετικά εδώ κι εδώ

[*] Το διαδραστικό διάγραμμα διασποράς (η γραφική παράσταση MCA) βασίζεται στα δεδομένα μιας έρευνας (περιλαμβάνεται στη βιβλιοθήκη FactoMineR του François Husson στη γλώσσα R) που πραγματοποιήθηκε σε παιδιά που υπέφεραν από τροφική δηλητηρίαση (dataset: poison). Στο παράδειγμα, κάθε σημείο της γραφικής παράστασης αντιπροσωπεύει μια παρατήρηση. Η θέση των σημείων καθορίζεται από τις δύο πρώτες διαστάσεις (Dim.1 και Dim.2) των αποτελεσμάτων της MCA και αφορά τον τρόπο με τον οποίο τα παιδιά αυτά σχετίζονται με τα συμπτώματα που παρουσίασαν με βάση το φύλο τους (Male/Female). Η διασπορά των σημείων στο γράφημα παρέχει πληροφορίες σχετικά με το πόσο διακριτά ή παρόμοια είναι τα συμπτώματα τροφικής δηλητηρίασης (ναυτία, εμετός, διάρροια, πυρετός κτλ.) που ανέφεραν παιδιά διαφορετικού φύλου σε σχέση με ό,τι δήλωσαν πως έφαγαν (ψάρι, μαγιονέζα, τυρί, παγωτό κτλ.). Εν συντομία, αλληλεπικάλυψη (ή γειντίαση) των σημείων υποδηλώνει ομοιότητα συμπτωμάτων, ενώ απόσταση των σημείων υποδηλώνει διαφοροποίηση συγκριτικά με το φύλο και ό,τι δήλωσαν πως κατανάλωσαν. Τέλος, η αριστερή πλευρά του γραφήματος (άξονας με τις αρνητικές τιμές) ομαδοποιεί όσες/ους τελικά νόσησαν, ενώ η δεξιά (άξονας με θετικές τιμές) όσους/ες δε νόσησαν.