Εμφάνιση αναρτήσεων με ετικέτα Μεθοδολογία. Εμφάνιση όλων των αναρτήσεων
Εμφάνιση αναρτήσεων με ετικέτα Μεθοδολογία. Εμφάνιση όλων των αναρτήσεων

Παρασκευή 5 Ιανουαρίου 2024

Στα παρασκήνια της ερευνητικής διαδικασίας: η σημασία της πιλοτικής έρευνας

Η πιλοτική έρευνα [1] αποτελεί μια μικρής κλίμακας δοκιμαστική έρευνα, που πραγματοποιείται στο πλαίσιο προετοιμασίας για την τελική έρευνα. Η διενέργεια πιλοτικής έρευνας, κατά τα πρώτα στάδια μιας ερευνητικής προσπάθειας, αποτελεί καθοριστικό βήμα για την επιτυχή ολοκλήρωση αυτής της προσπάθειας. Οι λόγοι για κάτι τέτοιο πολλοί: η πιλοτική έρευνα βοηθά τους ερευνητές και τις ερευνήτριες να βελτιώσουν το σχεδιασμό της έρευνάς τους, να καθορίσουν το κατάλληλο μέγεθος δείγματος, να διαμορφώσουν κατάλληλα τις ερωτήσεις τους, να εντοπίσουν τις αδυναμίες της μεθοδολογίας ή να εντοπίσουν τεχνικά προβλήματα που μπορεί να ανακύψουν, επιτρέποντάς τους την ίδια στιγμή να εκτιμήσουν το κόστος, σε χρόνο και χρήμα, του όλου εγχειρήματος.

Τα παρακάτω στοιχεία προέρχονται από μια πιλοτική ποσοτική έρευνα που διεξήχθη στα τέλη του 2019 σε δείγμα 79 εργαζόμενων και μέλη σωματείων στον κλάδο των τηλεπικοινωνιών. Σκοπός της έρευνας, η διερεύνηση της στάσης των εργαζόμενων απέναντι στη συνδικαλιστική δράση των σωματείων του κλάδου. Κατά το πρώτο στάδιο διεξαγωγής αυτής της έρευνας κρίθηκε απαραίτητη η πραγματοποίηση μιας πιλοτικής με σκοπό να βοηθήσει τόσο στον έλεγχο της εγκυρότητας (reliability) και της αξιοπιστίας (validity) του ερωτηματολογίου [2], όσο και στην τελική του διαμόρφωση -μέσα από τον τρόπο με τον οποίο αποκρίνονταν οι ερωτώμενοι στις ερωτήσεις.

Η πιλοτική αυτή έρευνα πέτυχε να αναδείξει τις αδυναμίες του αρχικού σύντομου ερωτηματολογίου. Καθοριστική όμως υπήρξε η συμβολή της και σε κάτι επιπλέον: στη ριζική αναμόρφωση του ερωτηματολογίου μέσα από τις απαντήσεις που καταγράφηκαν σε μια παραγκωνισμένη ερώτηση στο αρχικό ερωτηματολόγιο (ερώτηση κατάταξης, classification) πάνω στις διεκδικήσεις, που το ερχόμενο χρονικό διάστημα όφειλαν να θέσουν κατά προτεραιότητα τα σωματεία του κλάδου. 
 
- Ποια αιτήματα πρέπει να παλέψουν τα σωματεία το ερχόμενο διάστημα; 
 
Επιλέξτε κατά σειρά προτεραιότητας:
- Αυξήσεις μισθών
- Μείωση χρόνου εργασίας
- Υπεράσπιση θέσεων εργασίας ενάντια σε απολύσεις
- Βελτίωση συνθηκών εργασίας
- Σταθερή δουλειά

Η ανάδειξη θεμάτων όπως η βελτίωση των συνθηκών εργασίας (1η επιλογή 38.7%) ή η υπεράσπιση των θέσεων εργασίας (2η επιλογή 30.6%) έναντι αιτημάτων όπως οι αυξήσεις μισθών ή η μείωση του χρόνου εργασίας (βλ. το παραπάνω γράφημα) βοήθησε στην αναδιαμόρφωση και την προσθήκη νέων ερωτήσεων του κλειστού τύπου ερωτηματολογίου, όσο και στη συμπλήρωσή του μέσα από τη διενέργεια συνεντεύξεων με μέλη σωματείων του κλάδου. 
 
Παρόλα αυτά, οι πιλοτικές έρευνες δεν πρέπει να χρησιμοποιούνται ούτε για την εξαγωγή συμπερασμάτων ούτε στον έλεγχο υποθέσεων. Επιτυχημένες είναι όταν φέρνουν στην επιφάνεια αδυναμίες ή μη αναμενόμενα αποτελέσματα των μεθόδων που τίθενται σε εφαρμογή. Αντίθετα, η αγνόηση των θεμάτων που φωτίζουν μπορεί να θέσει σε κίνδυνο ακόμα και την ακεραιότητα του όλου ερευνητικού εγχειρήματος. 

Δ.Λ.

Σημειώσεις: 

[1] Smith, C.A. (2019), "The Uses of Pilot Studies in Sociology", The American Sociologist, 50, 589–607 https://doi.org/10.1007/s12108-019-09419-y

[2] Αξιοπιστία: σταθερότητα αποτελεσμάτων μέτρησης σε επαναλαμβανόμενες μετρήσεις. Εγκυρότητα: επιτυχής μέτρηση του επιδιωκόμενου.

Παρασκευή 13 Οκτωβρίου 2023

Ανάλυση Κοινωνικών Δικτύων: πρακτικός οδηγός με τη χρήση της γλώσσας R

Η Ανάλυση Κοινωνικών Δικτύων (ΑΚΔ) στις κοινωνικές επιστήμες αποτελεί μια τεχνική μελέτης της δομής των σχέσεων που συνέχουν άτομα, κοινωνικές ομάδες, φορείς, οργανισμούς, οντότητες. Παρέχει ένα πλαίσιο για την κατανόηση των δεσμών αλληλεξάρτησης που δημιουργούνται μεταξύ των παραπάνω, όσο και τη δράση τους μέσα στις κοινωνικές σχέσεις. Οι θεωρητικές πτυχές της ΑΚΔ περιλαμβάνουν βασικές έννοιες όπως αυτή των κόμβων (nodes) και των ακμών ή συνδέσμων (edges ή ties). Ας δούμε, εν τάχει, ένα απλό παράδειγμα ανάλυσης ενός μικρού φιλικού δικτύου πέντε ατόμων, αφού πρώτα αναφερθούμε στις έννοιες-κλειδιά αυτής της τεχνικής. 
 
  • Οι κόμβοι στην ανάλυση κοινωνικών δικτύων αντιπροσωπεύουν μεμονωμένες οντότητες, φορείς, ομάδες ή άτομα. (Στο παράδειγμα που θα δούμε παρακάτω οι κόμβοι επισημαίνονται ως "Άτομο 1", "Άτομο 2" και ούτω καθεξής).
  • Οι ακμές ή σύνδεσμοι αντιπροσωπεύουν τις σχέσεις ή τις αλληλεπιδράσεις μεταξύ των κόμβων του δικτύου.
Για την απεικόνιση των δικτύων χρησιμοποιούνται γράφοι και δυαδικοί πίνακες με γραμμές και στήλες ίσες με τους κόμβους του δικτύου. Επίσης, κεντρικής σημασίας στην ανάλυση δικτύων είναι τα μέτρα κεντρικότητας (Centrality Measures), όπως η Κεντρικότητα Βαθμού (Degree Centrality, ποσοτικός προσδιορισμός της σημασίας ενός κόμβου με βάση τις συνδέσεις του), η Διαμεσότητα (Betweenness Centrality, μέτρηση κόμβων που λειτουργούν ως γέφυρες ή σημεία ένωσης μεταξύ των κόμβων) και η Κεντρικότητα Εγγύτητας (Closeness Centrality, μέτρηση της προσβασιμότητας ενός κόμβου εντός του δικτύου, πόσο μακριά για παράδειγμα βρίσκεται ο ένας από τον άλλο κόμβο). Άλλες θεωρητικές πτυχές της ΑΚΔ περιλαμβάνουν την ανίχνευση κοινοτήτων (την αναγνώριση δηλαδή στενά συνδεδεμένων κόμβων), καθώς και τη μελέτη της δυναμικής εξέλιξης του δικτύου στο χρόνο. 
 
Ας επικεντρωθούμε τώρα στο παράδειγμα ενός φιλικού δικτύου πέντε ατόμων:
 
Πώς οι σχέσεις μεταξύ των πέντε αυτών φίλων επηρεάζουν την ανταλλαγή πληροφοριών μέσα στην ομάδα; Ποια άτομα έχουν τη μεγαλύτερη επιρροή εντός της και πώς οι αλληλεπιδράσεις τους αντανακλώνται στη συνοχή της ομάδας αυτής; 
 
Προκειμένου να κατανοήσουμε τις σχέσεις εντός αυτού του φιλικού δικτύου απαραίτητη είναι η καταγραφή των σχέσεων μεταξύ των πέντε φίλων σε έναν δυαδικό πίνακα με τη μορφή μιας μήτρας γειτνιάσεων (adjacency matrix) όπως παρακάτω. (Ο υπολογισμός των στατιστικών της ανάλυσης που παρουσιάζονται παρακάτω έγινε με τη βοήθεια της βιβλιοθήκης igraph για τη γλώσσα R. O κώδικας έχει δημοσιευτεί εδώ):
 
Άτομο 1Άτομο 2Άτομο 3Άτομο 4Άτομο 5
01010
10110
01011
11101
00110
 
Η τιμή 1 στον πίνακα υποδηλώνει την ύπαρξη σχέσης (ύπαρξη άμεσης εδώ φιλίας) μεταξύ των ατόμων, ενώ η τιμή 0 την απουσία της. Απεικονίζοντας τώρα, τον παραπάνω πίνακα αποκαλύπτονται οι πέντε φίλοι ως κόμβοι (κύκλοι) μαζί με τους δεσμούς φιλίας που τους συνέχουν, οι ακμές του δικτύου σε μορφή γραμμών.
 
 
Μπορούμε να δούμε ότι τα άτομα 1 και 4 έχουν κοινό φίλο το άτομο 2, τα 1 και 2 το άτομο 4, τα 2 και 4 το άτομο 1 κ.ο.κ. Ας προσέξουμε εδώ όμως, πως το άτομο 1 γνωρίζει τα άτομα 3 και 5, έμμεσα, μόνο μέσω άλλων ατόμων, όπως αντίστοιχα και το άτομο 5 το άτομο 1. Στο κέντρο του δικτύου βρίσκεται το άτομο 4, το οποίο είναι και αυτό με τις περισσότερες άμεσες φιλίες: οι περισσότεροι κόμβοι του δικτυού συνδέονται μαζί του με άμεσο τρόπο γεγονός που υποδηλώνει και το σημαντικό βαθμό επιρροής που ασκεί στα υπόλοιπα άτομα -απαντώντας και στο αρχικό ερώτημα. Αντίθετα, στην άκρη του δικτύου βρίσκονται τα άτομα 1 και 5, τα οποία έχουν τους λιγότερους κοινούς φίλους σε σχέση με τα υπόλοιπα άτομα.   
 
Centrality Measures
 
Degree: 2 3 3 4 2

Clustering Coefficient: 0.64 
 
Diameter: 2
 
Ο υπολογισμός μέτρων κεντρικότητας του δικτύου επιβεβαιώνει όσα αποκαλύπτει το γράφημα το οποίο είδαμε, προσφέροντας επιπλέον ορισμένες πληροφορίες για τη δομή αυτού του δικτύου. Η Κεντρικότητα Βαθμού, Degree, (2 για το άτομο 1, 3 για το άτομο 2, 3 για το άτομο 3, 4 για το άτομο 4 και 2 για το άτομο 5) δείχνει ότι τα άτομα 2, 3 και 4 έχουν περισσότερες συνδέσεις από τα άτομα 1 και 5. Ο συντελεστής ομαδοποίησης (Clustering Coefficient) που παίρνει τιμές από το 0 έως το 1, δείχνει ότι το δίκτυο έχει υψηλό βαθμό ομαδοποίησης και συνοχής. Πρακτικά αυτό σημαίνει πως φίλοι/ες ενός ατόμου δυνητικά μπορεί να είναι (ή να γίνουν) φίλοι/ες με άλλα άτομα μέσα από το δίκτυο. Τέλος, Διάμετρος 2 σημαίνει πως η πιο σύντομη διαδρομή μεταξύ δύο ατόμων στο δίκτυο είναι 2. Με άλλα λόγια, στην παρούσα ομάδα φίλων ένα άτομο μπορεί να προσεγγίσει οποιοδήποτε άλλο άτομο μέσα από το πολύ δύο σχέσεις φιλίας. 
 
Εν κατακλείδι, σε ένα δίκτυο όπως αυτό, όπου ένα άτομο, το Άτομο 4, έχει περισσότερες άμεσες συνδέσεις, οι πληροφορίες ρέουν πιο εύκολα μέσω αυτού προτού αγγίξουν κάθε κόμβο. Αν και η ύπαρξη υποομάδων είναι αυτή που μπορεί δυνητικά να επηρεάσει την ανταλλαγή πληροφοριών μέσα σε μια ομάδα, στην περίπτωση αυτή κάτι τέτοιο δε συμβαίνει, όπως προκύπτει από τη μικρή διάμετρο του δικτύου.  

Δ.Λ.

Παρασκευή 15 Σεπτεμβρίου 2023

O Benzécri και η γαλλική σχολή ανάλυσης δεδομένων (1960-1990)


Jean-Paul Benzécri, 1932–2019
 
Ο Jean-Paul Benzécri, μαθηματικός και στατιστικολόγος που συνέβαλε καθοριστικά στον τομέα της πολυμεταβλητής στατιστικής ανάλυσης, θεωρείται ο ιδρυτής της γαλλικής σχολής ανάλυσης δεδομένων [1]. Έγινε ιδιαίτερα γνωστός στη Γαλλία κατά τη δεκαετία του 1960 για τις εργασίες του πάνω στην Παραγοντική Ανάλυση Αντιστοιχιών (Analyse Factorielle des Correspondances), μια τεχνική που χρησιμοποιείται στην ανάλυση ποσοτικών δεδομένων.

Ο Benzécri γεννήθηκε στην Τουλούζ της Γαλλίας το 1932 και σπούδασε στην École Normale Supérieure στο Παρίσι (1950). To 1955 έλαβε τη διδακτορική του διατριβή από το Πανεπιστήμιο του Πρίνστον υπό την επίβλεψη του Henri Cartan -γνωστό για τις εργασίες του πάνω στην αλγεβρική τοπολογία. Όταν το 1965 εκλέγεται καθηγητής στη Σορβόννη ιδρύει το Laboratoire de Statistique, εντός του Ινστιτούτου Στατιστικής του Παρισιού, όπου παραδίδει μαθήματα πάνω στην ανάλυση δεδομένων (analyse des données). Εκεί αναπτύσσει περαιτέρω τις εργασίες του πάνω στην Παραγοντική Ανάλυση Αντιστοιχιών, μέθοδο που καθιστά δυνατή την επεξεργασία κατηγορικών δεδομένων μέσα από την οπτικοποίηση και ιεράρχηση των πληροφοριών που αυτά παρέχουν.
 
 
(Πολλαπλή Ανάλυση Αντιστοιχιών | Libraries: FactoMineR, ggplot2, plotly | dataset: poison) [*]


Συνοπτικά, η Ανάλυση Αντιστοιχιών (CA) αποτελεί στατιστική μέθοδο που χρησιμοποιείται για τη διερεύνηση των σχέσεων μεταξύ κατηγορικών μεταβλητών σε έναν δισδιάστατο χώρο. Η ισχύς της μεθόδου, και κυρίως της Πολλαπλής Ανάλυσης Αντιστοιχιών (MCA) που αποτελεί γενίκευσή της, έγκειται στον εντοπισμό επαναλαμβανόμενων μοτίβων μέσα από τη μείωση της πολυπλοκότητας πολυδιάστατων δεδομένων. Η τεχνική αυτή, φέρνει παράλληλα στο φως μη φανερές συσχετίσεις μεταξύ πολλών διαφορετικών μεταβλητών. Για το λόγο αυτό τα ευρήματά της είναι πολύτιμα στη λήψη αποφάσεων και πλέον έχουν ευρύ φάσμα εφαρμογών από τη βιολογία έως τις κοινωνικές επιστήμες. Στην κοινωνιολογία, η χρήση της μεθόδου από τον Pierre Bourdieu (1930-2002) υπήρξε καθοριστική στη μελέτη της κατανομής του πολιτισμικού κεφαλαίου της γαλλικής κοινωνίας του καιρού του. (Βλ. πιο αναλυτικά εδώ).

Δ.Λ.

Σημειώσεις:


[1] Βλ. σχετικά εδώ κι εδώ

[*] Το διαδραστικό διάγραμμα διασποράς (η γραφική παράσταση MCA) βασίζεται στα δεδομένα μιας έρευνας (περιλαμβάνεται στη βιβλιοθήκη FactoMineR του François Husson στη γλώσσα R) που πραγματοποιήθηκε σε παιδιά που υπέφεραν από τροφική δηλητηρίαση (dataset: poison). Στο παράδειγμα, κάθε σημείο της γραφικής παράστασης αντιπροσωπεύει μια παρατήρηση. Η θέση των σημείων καθορίζεται από τις δύο πρώτες διαστάσεις (Dim.1 και Dim.2) των αποτελεσμάτων της MCA και αφορά τον τρόπο με τον οποίο τα παιδιά αυτά σχετίζονται με τα συμπτώματα που παρουσίασαν με βάση το φύλο τους (Male/Female). Η διασπορά των σημείων στο γράφημα παρέχει πληροφορίες σχετικά με το πόσο διακριτά ή παρόμοια είναι τα συμπτώματα τροφικής δηλητηρίασης (ναυτία, εμετός, διάρροια, πυρετός κτλ.) που ανέφεραν παιδιά διαφορετικού φύλου σε σχέση με ό,τι δήλωσαν πως έφαγαν (ψάρι, μαγιονέζα, τυρί, παγωτό κτλ.). Εν συντομία, αλληλεπικάλυψη (ή γειντίαση) των σημείων υποδηλώνει ομοιότητα συμπτωμάτων, ενώ απόσταση των σημείων υποδηλώνει διαφοροποίηση συγκριτικά με το φύλο και ό,τι δήλωσαν πως κατανάλωσαν. Τέλος, η αριστερή πλευρά του γραφήματος (άξονας με τις αρνητικές τιμές) ομαδοποιεί όσες/ους τελικά νόσησαν, ενώ η δεξιά (άξονας με θετικές τιμές) όσους/ες δε νόσησαν. 

Παρασκευή 5 Μαΐου 2023

Διαδικτυακό σεμινάριο στην ποσοτική ανάλυση με τη χρήση των SPSS και R για αρχάριους: εγγραφείτε τώρα


ΣΕΙΡΑ 1

Περιεχόμενα:
 

1. Μάθετε πώς να χρησιμοποιείτε το SPSS και τη γλώσσα R στην ποσοτική ανάλυση.

2. Παραδείγματα προετοιμασίας δεδομένων με τη χρήση των δυο προγραμμάτων λογισμικού.

3. Περιγραφική στατιστική, διερευνητική ανάλυση δεδομένων, μέτρα κεντρικής τάσης, διασποράς και ανάλυση συσχέτισης.

4. Μελέτες περίπτωσης (case studies) με τη χρήση ποσοτικών μεθόδων στην ανάλυση οικονομικών στάσεων.
 
Δεν απαιτείται πρότερη γνώση του SPSS ή της γλώσσας R.

Λεπτομέρειες:

- Ημερομηνία: 5/5
- Ώρα: 20:30 - 21:30
- Διάρκεια: 120 λεπτά
- Παρουσίαση: Γιώργος Ευαγγέλου & Δημήτρης Λάζαρης 
 
Συνδεθείτε στο zoom κάνωντας κλικ
  

Παρασκευή 2 Δεκεμβρίου 2022

Aνάλυση δεδομένων μέσα από εφαρμογές


Το βιβλίο αυτό αφορά την ανάλυση δεδομένων (data analysis) και δίνει έμφαση στην πρακτική της προβλεπτικής μοντελοποίησης (predictive modeling). Ο όρος προβλεπτική μοντελοποίηση μπορεί να προκαλεί συνειρμούς με τη μηχανική εκμάθηση (machine learning), την αναγνώριση μοτίβων (pattern recognition) και την εξόρυξη δεδομένων (data mining). Μπορεί οι συνειρμοί αυτοί να είναι σωστοί και οι μέθοδοι που υπονοούνται από αυτούς τους όρους να αποτελούν αναπόσπαστο κομμάτι της διαδικασίας της προβλεπτικής μοντελοποίησης, παρόλα αυτά η προβλεπτική μοντελοποίηση περιλαμβάνει πολλά περισσότερα πράγματα από εργαλεία και τεχνικές αποκάλυψης μοτίβων στα δεδομένων. Η πρακτική της προβλεπτικής μοντελοποίησης ορίζει τη διαδικασία ανάπτυξης ενός μοντέλου κατά τρόπο τέτοιο ώστε να είναι εφικτή η κατανόηση και η ποσοτικοποίηση της ακρίβειας μιας πρόβλεψης πάνω σε μελλοντικά δεδομένα που δεν είναι ακόμα γνωστά. Το σύνολο της διαδικασίας αυτής βρίσκεται στο επίκεντρο αυτού του βιβλίου*.

(Max Kuhn and Kjell Johnson, Applied Predictive Modeling [* Από την εισαγωγή, μτφρ. Δ. Λ.])