Η εποπτευόμενη, η χωρίς επίβλεψη και η ενισχυτική μάθηση είναι τρεις διαφορετικές προσεγγίσεις στον τομέα της μηχανικής μάθησης. Κάθε προσέγγιση χρησιμοποιεί διαφορετικές τεχνικές και αλγόριθμους για την αντιμετώπιση διαφορετικών τύπων προβλημάτων και την επίτευξη συγκεκριμένων στόχων. Ας διερευνήσουμε τις διαφορές μεταξύ αυτών των προσεγγίσεων και ας παρέχουμε μια ολοκληρωμένη εξήγηση των χαρακτηριστικών και των εφαρμογών τους.
Η εποπτευόμενη μάθηση είναι ένας τύπος μηχανικής μάθησης όπου ο αλγόριθμος μαθαίνει από δεδομένα με ετικέτα. Τα επισημασμένα δεδομένα αποτελούνται από παραδείγματα εισόδου που έχουν συζευχθεί με την αντίστοιχη σωστή έξοδο ή τιμή στόχο. Ο στόχος της εποπτευόμενης μάθησης είναι να εκπαιδεύσει ένα μοντέλο που μπορεί να προβλέψει με ακρίβεια την έξοδο για νέες, αόρατες εισροές. Ο αλγόριθμος εκμάθησης χρησιμοποιεί τα δεδομένα με ετικέτα για να συμπεράνει μοτίβα και σχέσεις μεταξύ των χαρακτηριστικών εισόδου και των ετικετών εξόδου. Στη συνέχεια, γενικεύει αυτή τη γνώση για να κάνει προβλέψεις για νέα δεδομένα χωρίς ετικέτα. Η εποπτευόμενη μάθηση χρησιμοποιείται συνήθως σε εργασίες όπως η ταξινόμηση και η παλινδρόμηση.
Για παράδειγμα, σε ένα πρόβλημα ταξινόμησης, ο αλγόριθμος εκπαιδεύεται σε ένα σύνολο δεδομένων όπου κάθε σημείο δεδομένων επισημαίνεται με μια συγκεκριμένη κλάση. Ο αλγόριθμος μαθαίνει να ταξινομεί νέα, μη ορατά σημεία δεδομένων σε μία από τις προκαθορισμένες κλάσεις με βάση τα μοτίβα που έχει μάθει από τα επισημασμένα παραδείγματα. Σε ένα πρόβλημα παλινδρόμησης, ο αλγόριθμος μαθαίνει να προβλέπει μια συνεχή αριθμητική τιμή με βάση τα χαρακτηριστικά εισόδου.
Η μάθηση χωρίς επίβλεψη, από την άλλη πλευρά, ασχολείται με δεδομένα χωρίς ετικέτα. Ο στόχος της μάθησης χωρίς επίβλεψη είναι να ανακαλύψει κρυφά μοτίβα, δομές ή σχέσεις μέσα στα δεδομένα χωρίς προηγούμενη γνώση των ετικετών εξόδου. Σε αντίθεση με την εποπτευόμενη μάθηση, οι αλγόριθμοι μάθησης χωρίς επίβλεψη δεν έχουν σαφείς τιμές-στόχους για να καθοδηγήσουν τη διαδικασία μάθησης. Αντίθετα, επικεντρώνονται στην εύρεση ουσιαστικών αναπαραστάσεων ή συστάδων στα δεδομένα. Η μάθηση χωρίς επίβλεψη χρησιμοποιείται συνήθως σε εργασίες όπως η ομαδοποίηση, η μείωση διαστάσεων και η ανίχνευση ανωμαλιών.
Η ομαδοποίηση είναι μια δημοφιλής εφαρμογή της μάθησης χωρίς επίβλεψη, όπου ο αλγόριθμος ομαδοποιεί παρόμοια σημεία δεδομένων με βάση τις εγγενείς ιδιότητές τους. Για παράδειγμα, στην τμηματοποίηση πελατών, ένας αλγόριθμος μάθησης χωρίς επίβλεψη μπορεί να χρησιμοποιηθεί για τον προσδιορισμό διακριτών ομάδων πελατών με βάση την αγοραστική τους συμπεριφορά ή δημογραφικές πληροφορίες.
Η ενισχυτική μάθηση είναι ένα διαφορετικό παράδειγμα όπου ένας πράκτορας μαθαίνει να αλληλεπιδρά με ένα περιβάλλον για να μεγιστοποιήσει ένα σωρευτικό σήμα ανταμοιβής. Στην ενισχυτική μάθηση, ο αλγόριθμος μαθαίνει μέσω μιας διαδικασίας δοκιμής και λάθους κάνοντας ενέργειες, παρατηρώντας την κατάσταση του περιβάλλοντος και λαμβάνοντας ανατροφοδότηση με τη μορφή ανταμοιβών ή ποινών. Ο στόχος είναι να βρεθεί μια βέλτιστη πολιτική ή ένα σύνολο ενεργειών που μεγιστοποιούν τη μακροπρόθεσμη ανταμοιβή. Η ενισχυτική μάθηση χρησιμοποιείται συνήθως σε εργασίες όπως το παιχνίδι, η ρομποτική και τα αυτόνομα συστήματα.
Για παράδειγμα, στο παιχνίδι σκάκι, ένας ενισχυτικός εκπαιδευτικός μπορεί να μάθει να παίζει εξερευνώντας διαφορετικές κινήσεις, λαμβάνοντας ανταμοιβές ή ποινές με βάση το αποτέλεσμα κάθε κίνησης και προσαρμόζοντας τη στρατηγική του για να μεγιστοποιήσει τις πιθανότητες νίκης.
Η εποπτευόμενη μάθηση χρησιμοποιεί δεδομένα με ετικέτα για να εκπαιδεύσει ένα μοντέλο για εργασίες πρόβλεψης, η μη εποπτευόμενη μάθηση ανακαλύπτει μοτίβα και δομές σε δεδομένα χωρίς ετικέτα και η ενισχυτική μάθηση μαθαίνει μέσω της αλληλεπίδρασης με ένα περιβάλλον για τη μεγιστοποίηση ενός σήματος ανταμοιβής. Κάθε προσέγγιση έχει τα δικά της δυνατά και αδύνατα σημεία και είναι κατάλληλη για διαφορετικούς τύπους προβλημάτων και εφαρμογών.
Άλλες πρόσφατες ερωτήσεις και απαντήσεις σχετικά με EITC/AI/GCML Google Cloud Machine Learning:
- Τι είναι το κείμενο σε ομιλία (TTS) και πώς λειτουργεί με την τεχνητή νοημοσύνη;
- Ποιοι είναι οι περιορισμοί στην εργασία με μεγάλα σύνολα δεδομένων στη μηχανική εκμάθηση;
- Μπορεί η μηχανική μάθηση να προσφέρει κάποια διαλογική βοήθεια;
- Τι είναι η παιδική χαρά TensorFlow;
- Τι σημαίνει στην πραγματικότητα ένα μεγαλύτερο σύνολο δεδομένων;
- Ποια είναι μερικά παραδείγματα υπερπαραμέτρων του αλγορίθμου;
- Τι είναι η εκμάθηση συνόλου;
- Τι γίνεται αν ένας επιλεγμένος αλγόριθμος μηχανικής εκμάθησης δεν είναι κατάλληλος και πώς μπορεί κανείς να βεβαιωθεί ότι θα επιλέξει τον σωστό;
- Χρειάζεται επίβλεψη ένα μοντέλο μηχανικής μάθησης κατά τη διάρκεια της εκπαίδευσής του;
- Ποιες είναι οι βασικές παράμετροι που χρησιμοποιούνται σε αλγόριθμους βασισμένους σε νευρωνικά δίκτυα;
Δείτε περισσότερες ερωτήσεις και απαντήσεις στο EITC/AI/GCML Google Cloud Machine Learning