Εισαγωγή στην ανάλυση υγειονομικών δεδομένων πραγματικού κόσμου

Εισαγωγικά

Στόχοι



Τελικός στόχος είναι η ιατρική απόφαση



  • Γνώση των πιθανών θεραπειών
  • Καθορισμός των αποτελεσμάτων ενδιαφέροντος
  • Καθορισμός ενός χρονικού πλαισίου

Πειραματισμός



Κλινικές δοκιμές



Η βασική μέθοδος εξαγωγής συμπερασμάτων



  • Λήψη τυχαίου αντιπροσωπευτικού δείγματος από τον πληθυσμό
  • Τυχαιοποιημένη διανομή θεραπειών ενδιαφέροντος
  • Αυστηρά προκαθορισμένα αποτελέσματα ενδιαφέροντος
  • Αυστηρά προκαθορισμένα χρονικά πλαίσια

Κλινικές δοκιμές



Κλινικές δοκιμές - Παράδειγμα




Πληθυσμός: Ασθενείς με οξύ έμφραγμα του μυοκαρδίου

Θεραπείες:

  • Ιστικός ενεργοποιητής πλασμινογόνου (αλτεπλάση)
  • Στρεπτοκινάση

Αποτέλεσμα: Θάνατος

Χρονικό πλαίσιο: 30 ημέρες

Κλινικές δοκιμές - Παράδειγμα



Κλινικές δοκιμές - Παράδειγμα



  • Η έκβαση ενδιαφέροντος είναι δυαδική (0 ή 1)



Πώς μοντελοποιούμε μία τέτοια έκβαση;

Κλινικές δοκιμές - Παράδειγμα



Λογιστική παλινδρόμηση


\[ log(\frac{p}{1-p}) = \beta_0+\beta_1x_1+\dots+\beta_px_p \]

  • \(p\) είναι η πιθανότητα να συμβεί το αποτέλεσμα ενδιαφέροντος
  • \(x_1,\dots,x_p\) είναι οι μεταβλητές που έχουμε καταγράψει
  • \(\beta_0,\dots,\beta_p\) είναι οι παράμετροι του μοντέλου

Κλινικές δοκιμές - Παράδειγμα



Το μοντέλο που θα χρησιμοποιήσουμε για τη σύγκριση των δύο θεραπειών:

\[ log(\frac{p}{1-p}) = \beta_0 + \beta_t\times treatment \]


Το αποτέλεσμα της ανάλυσης:

\[OR = e^{\beta_t} = e^{-0.16} \approx 0.85\]

Περιορισμοί κλινικών δοκιμών



  • Απαιτούν πολύ χρόνο
  • Έχουν πολύ μεγάλο κόστος
  • Απαιτούν τη στρατολόγηση μεγάλου αριθμού συμμετεχόντων
  • Μελετούν πολύ συγκεκριμένους πληθυσμούς
  • Συνήθως απαντούν σε έναν πολύ περιορισμένο αριθμό ερωτημάτων
  • Εξ’ορισμού, απαιτούν πειραματισμό — ηθικά ζητήματα

Δεδομένα πραγματικού κόσμου

Δεδομένα πραγματικού κόσμου



Οι ασθενείς, κατά την αλληλεπίδρασή τους με το σύστημα υγείας παράγουν έναν τεράστιο όγκο δεδομένων.


  • Ηλεκτρονικά συστήματα νοσοκομείων
  • Ηλεκτρονικά συστήματα παρόχων πρωτοβάθμιας περίθαλψης
  • Συστήματα παρόχων ηλεκτρονικής συνταγογράφησης
  • Συστήματα ασφαλιστικών εταιρειών
  • Μητρώα ασθενών

Πλεονεκτήματα



  • Χρειάζονται σημαντικά λιγότερο χρόνο
  • Τα αποτελέσματα μπορούν πιο εύκολα να γενικευθούν
  • Περιέχουν διαφορετικούς πληθυσμούς

Πλεονεκτήματα



  • Μειώνουν την έκθεση των ασθενών σε κινδύνους
  • Μπορούν να βοηθήσουν στη μελέτη σπάνιων ασθενειών
  • Μπορούν να πραγματοποιηθούν σε συνθήκες που ο πειραματισμός είναι αδύνατος

Μειονεκτήματα



  • Συχνά περιορισμένη αντιπροσωπευτικότητα
  • Ασυνέχεια στην καταγραφή της κατάστασης των ασθενών
  • Συστηματική απώλεια πληροφορίας (π.χ. ιατρικό ιστορικό)
  • Τεράστιο πλήθος τρόπων αποθήκευσης των δεδομένων

Μειονεκτήματα



  • Συστηματικό σφάλμα επιλογής (selection bias)
    • Μεροληψία του Berkson (Berkson bias)
    • Prevalent-user bias
    • Immortal time bias

Πλασματική συσχέτιση



Πλασματική συσχέτιση - Παράδειγμα


Δημιουργία συγχυτικού παράγοντα


\[ log(\frac{p_{treatment}}{1-p_{treatment}}) = -0.013 - 0.92\times sex\_male \]


\[ log(\frac{p_{outcome}}{1 - p_{outcome}}) = -1.92 - 0.92\times sex\_male - 0.16\times treatment \]

Πλασματική συσχέτιση - Παράδειγμα


Πλασματική συσχέτιση - Παράδειγμα



Αν χρησιμοποιήσουμε την ίδια μέθοδο με πριν για να υπολογίσουμε την επίδραση της θεραπείας, θα έχουμε:

\[ log(\frac{p}{1-p}) = \beta_0 + \beta_t\times treatment \]

Το αποτέλεσμα της ανάλυσης:

\[OR = e^{\beta_t} = e^{0.05} \approx 1.05 \neq0.85 (RCT)\]

Πλασματική συσχέτιση



Αν οι συγχυτικοί παράγοντες της ανάλυσής μας είναι γνωστοί, μπορούμε να αντιμετωπίσουμε την επίδρασή τους συμπεριλαμβάνοντάς τους στο μοντέλο.

Πλασματική συσχέτιση - Παράδειγμα



\[ log(\frac{p}{1-p}) = \beta_0 + \beta_t\times treatment + \beta_{male}\times sex\_male \]


Το αποτέλεσμα της ανάλυσης:

\[OR = e^{\beta_t} = e^{-0.15} \approx 0.86 \approx0.85 (RCT)\]

Συγχυτικοί παράγοντες - Πλήθος



Τι κάνουμε αν το πλήθος των γνωστών συγχυτικών παραγόντων είναι πολύ μεγάλο;

Συγχυτικοί παράγοντες - Πλήθος



Πιθανή λύση

Συμπερίληψη όλων των συγχυτικών παραγόντων στο μοντέλο

Συγχυτικοί παράγοντες - Πλήθος



Σκορ ροπής
Πιθανότητα χορήγησης στον ασθενή της θεραπείας ενδιαφέροντος

Σκορ ροπής



Το μοντέλο που χρησιμοποιούμε για την εξαγωγή των σκορ ροπής είναι της μορφής:

\[ \log(\frac{p_{treatment}}{1 - p_{treatment}}) = \beta_0+\beta_1x_{1}+\dots+\beta_px_p, \]

όπου \(x_1,\dots,x_p\) είναι γνωστοί συγχυτικοί παράγοντες.

Συγχυτικοί παράγοντες - Πλήθος



Χρήση

Τα σκορ ροπής, συνήθως, χρησιμοποιούνται για να αντιστοιχίσουν ασθενείς που λαμβάνουν τη θεραπεία ενδιαφέροντος με ασθενείς που λαμβάνουν την εναλλακτική θεραπεία

Συγχυτικοί παράγοντες - Παράδειγμα



Το μοντέλο που καθορίζει τις πιθανότητες λήψης της θεραπείας ενδιαφέροντος (αλτεπλάση)


\[ \begin{align} log(\frac{p_{treatment}}{1-p_{treatment}}) = &-0.60 - 0.92\times sex\_male\\ &-0.11\times (age - \overline{age})\\ &+ 0.05\times (sysbp - \overline{sysbp}) \end{align} \]

Συγχυτικοί παράγοντες - Παράδειγμα



Το μοντέλο που καθορίζει τις πιθανότητες του αποτελέσματος ενδιαφέροντος (θάνατος)

\[ \begin{align} log(\frac{p_{outcome}}{1-p_{outcome}}) = &-3 - 0.92\times sex\_male\\ &-0.10\times (age - \overline{age})\\ &+0.05\times (sysbp - \overline{sysbp})\\ &-0.16\times treatment \end{align} \]

Συγχυτικοί παράγοντες - Παράδειγμα


Συγχυτικοί παράγοντες - Παράδειγμα


Συγχυτικοί παράγοντες - Παράδειγμα


Συγχυτικοί παράγοντες - Παράδειγμα


Συγχυτικοί παράγοντες - Παράδειγμα



\[ log(\frac{p}{1-p}) = \beta_0 + \beta_t\times treatment \]

Το αποτέλεσμα της ανάλυσης:

\[OR = e^{\beta_t} = e^{0.17} \approx 1.19 \neq0.85 (RCT)\]

Συγχυτικοί παράγοντες - Παράδειγμα



Το μοντέλο που θα χρησιμοποιήσουμε για τον υπολογισμό των σκορ ροπής

\[ \begin{align} \log(\frac{p_{treatment}}{1-p_{treatment}}) = &\beta_0+\beta_{male}\times sex\_male\\ &+\beta_{age}\times age+\beta_{sysbp}\times sysbp \end{align} \]

Συγχυτικοί παράγοντες - Παράδειγμα



Το αποτέλεσμα της ανάλυσης, ύστερα από αντιστοίχιση:

\[OR = e^{\beta_t} = e^{-0.14} \approx 0.87 \approx 0.85 (RCT)\]

Συγχυτικοί παράγοντες - Παράδειγμα


Συγχυτικοί παράγοντες - Παράδειγμα


Απαρατήρητοι συγχυτικοί παράγοντες



Απαρατήρητοι συγχυτικοί παράγοντες



Αρνητικοί έλεγχοι

Ιατρικά αποτελέσματα τα οποία γνωρίζουμε ότι δεν σχετίζονται με τις θεραπείες που συγκρίνουμε.

Απαρατήρητοι συγχυτικοί παράγοντες



Αρνητικοί έλεγχοι



Δημιουργία αρνητικού ελέγχου


\[ \begin{align} log(\frac{p_{nc}}{1-p_{nc}}) = &-2.64 - 0.15\times sex\_male\\ &-0.02\times (age - \overline{age})\\ &+ 0.1\times (sysbp - \overline{sysbp}) \end{align} \]

Αρνητικοί έλεγχοι



Μοντέλο για την πιθανότητα λήψης της θεραπείας ενδιαφέροντος (αλτεπλάση)

\[ \begin{align} log(\frac{p_{treatment}}{1-p_{treatment}}) = &-0.60 - 0.92\times sex\_male\\ &-0.11\times (age - \overline{age})\\ &+ 0.05\times (sysbp - \overline{sysbp}) \end{align} \]

Συγχυτικοί παράγοντες - Παράδειγμα



Μοντέλο για το αποτέλεσμα ενδιαφέροντος (θάνατος)

\[ \begin{align} log(\frac{p_{outcome}}{1-p_{outcome}}) = &-3 - 0.92\times sex\_male\\ &-0.10\times (age - \overline{age})\\ &+0.05\times (sysbp - \overline{sysbp})\\ &-0.16\times treatment \end{align} \]

Συγχυτικοί παράγοντες - Παράδειγμα



Μοντέλο για τα σκορ ροπής


\[ log(\frac{p_{treatment}}{1-p_{treatment}}) = \beta_0+\beta_{male}\times sex\_male + \beta_{age}\times age \]

Ανάλυση ευαισθησίας



Ανάλυση ευαισθησίας



Σωστό μοντέλο για τα σκορ ροπής


\[ \begin{align} log(\frac{p_{treatment}}{1-p_{treatment}}) = &\beta_0+\beta_{male}\times sex\_male\\ &+ \beta_{age}\times age + \beta_{sysbp}\times sysbp \end{align} \]

Ανάλυση ευαισθησίας



Ανακεφαλαίωση

Ανακεφαλαίωση



Τα δεδομένα πραγματικού κόσμου προσφέρουν μεγάλες δυνατότητες αντιμετώπισης των ζητημάτων που μπορεί να σχετίζονται με την εκτέλεση κλινικών δοκιμών

Ανακεφαλαίωση



Τα δεδομένα πραγματικού κόσμου εισάγουν νέες προκλήσεις για τη σωστή ανάλυσή τους

Ανακεφαλαίωση



Μία από τις μεγαλύτερες προκλήσεις στην ανάλυση δεδομένων πραγματικού κόσμου είναι η αντιμετώπιση των συγχυτικών παραγόντων

Ανακεφαλαίωση



Στην περίπτωση μικρού αριθμού και καλά καθορισμένων συγχυτικών παραγόντων, απλή συμπερίληψή τους στο μοντέλο για το αποτέλεσμα ενδιαφέροντος αρκεί για την εξαγωγή σωστών συμπερασμάτων

Ανακεφαλαίωση



Στην περίπτωση μεγάλου αριθμού συγχυτικών παραγόντων οι οποίοι έχουν μετρηθεί επαρκώς στο δείγμα της ανάλυσης, αντιστοίχιση με τα σκορ ροπής οδηγεί στην εξαγωγή σωστών συμπερασμάτων

Ανακεφαλαίωση



Σε κάθε περίπτωση, ανάλυση ευαισθησίας με τη χρήση αρνητικών ελέγχων μπορεί να χρησιμοποιηθεί για να εξεταστεί η απουσία συγχυτικών παραγόντων από την πραγματοποιούμενη ανάλυση