Για να εξαγάγετε μέσω προγραμματισμού ετικέτες από εικόνες χρησιμοποιώντας Python και το Vision API, μπορείτε να αξιοποιήσετε τις ισχυρές δυνατότητες του Google Cloud Vision API. Το Vision API παρέχει ένα ολοκληρωμένο σύνολο λειτουργιών ανάλυσης εικόνων, συμπεριλαμβανομένης της ανίχνευσης ετικετών, που σας επιτρέπει να αναγνωρίζετε αυτόματα και να εξάγετε ετικέτες από εικόνες.
Για να ξεκινήσετε, θα χρειαστεί να ρυθμίσετε ένα έργο Google Cloud και να ενεργοποιήσετε το Vision API. Αφού το κάνετε αυτό, μπορείτε να εγκαταστήσετε τις απαιτούμενες βιβλιοθήκες Python εκτελώντας την ακόλουθη εντολή:
python pip install google-cloud-vision
Στη συνέχεια, πρέπει να ελέγξετε την ταυτότητα της εφαρμογής σας για να αποκτήσετε πρόσβαση στο Vision API. Μπορείτε να το κάνετε αυτό δημιουργώντας ένα κλειδί λογαριασμού υπηρεσίας και ρυθμίζοντας τη μεταβλητή περιβάλλοντος «GOOGLE_APPLICATION_CREDENTIALS» ώστε να δείχνει τη διαδρομή του αρχείου κλειδιού. Αυτό μπορεί να γίνει χρησιμοποιώντας τον ακόλουθο κώδικα:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Τώρα, μπορείτε να χρησιμοποιήσετε το Vision API για εξαγωγή ετικετών από εικόνες μέσω προγραμματισμού. Το ακόλουθο απόσπασμα κώδικα δείχνει πώς να το κάνετε αυτό:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
Σε αυτόν τον κώδικα, δημιουργούμε πρώτα μια παρουσία της κλάσης «ImageAnnotatorClient» από τη βιβλιοθήκη «google.cloud.vision». Στη συνέχεια διαβάζουμε το αρχείο εικόνας, δημιουργούμε ένα αντικείμενο «Εικόνα» από το περιεχόμενο του αρχείου και το στέλνουμε στο Vision API για ανίχνευση ετικετών. Η απάντηση API περιέχει μια λίστα με σχολιασμούς ετικετών, από την οποία εξάγουμε τις περιγραφές των ετικετών.
Τώρα μπορείτε να καλέσετε τη συνάρτηση «extract_labels» περνώντας τη διαδρομή προς το αρχείο εικόνας που θέλετε να αναλύσετε. Θα επιστρέψει μια λίστα ετικετών που έχουν εξαχθεί από την εικόνα.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Αυτό θα εξάγει τις εξαγόμενες ετικέτες από την εικόνα.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Το Vision API χρησιμοποιεί προηγμένα μοντέλα μηχανικής εκμάθησης για την ανάλυση εικόνων και τον εντοπισμό αντικειμένων, σκηνών και άλλων οπτικών χαρακτηριστικών. Μπορεί να ανιχνεύσει με ακρίβεια ένα ευρύ φάσμα ετικετών, καθιστώντας το πολύτιμο εργαλείο για διάφορες εφαρμογές όπως ταξινόμηση εικόνων, εποπτεία περιεχομένου και οπτική αναζήτηση.
Για να εξαγάγετε μέσω προγραμματισμού ετικέτες από εικόνες χρησιμοποιώντας Python και το Vision API, πρέπει να ρυθμίσετε ένα έργο Google Cloud, να ενεργοποιήσετε το Vision API, να εγκαταστήσετε τις απαιτούμενες βιβλιοθήκες Python, να ελέγξετε την ταυτότητα της εφαρμογής σας και, στη συνέχεια, να χρησιμοποιήσετε το Vision API για να εκτελέσετε ανίχνευση ετικετών στο εικόνες. Οι εξαγόμενες ετικέτες μπορούν να χρησιμοποιηθούν για περαιτέρω ανάλυση ή για βελτίωση της κατανόησης του περιεχομένου της εικόνας.
Άλλες πρόσφατες ερωτήσεις και απαντήσεις σχετικά με EITC/AI/GVAPI Google Vision API:
- Ποιες είναι μερικές προκαθορισμένες κατηγορίες για την αναγνώριση αντικειμένων στο Google Vision API;
- Το Google Vision API ενεργοποιεί την αναγνώριση προσώπου;
- Πώς μπορεί να προστεθεί το εμφανιζόμενο κείμενο στην εικόνα όταν σχεδιάζετε περιγράμματα αντικειμένων χρησιμοποιώντας τη συνάρτηση "draw_vertices";
- Ποιες είναι οι παράμετροι της μεθόδου "draw.line" στον παρεχόμενο κώδικα και πώς χρησιμοποιούνται για τη χάραξη γραμμών μεταξύ των τιμών των κορυφών;
- Πώς μπορεί να χρησιμοποιηθεί η βιβλιοθήκη μαξιλαριού για τη σχεδίαση περιγραμμάτων αντικειμένων στην Python;
- Ποιος είναι ο σκοπός της συνάρτησης "draw_vertices" στον παρεχόμενο κώδικα;
- Πώς μπορεί το Google Vision API να βοηθήσει στην κατανόηση σχημάτων και αντικειμένων σε μια εικόνα;
- Πώς μπορούν οι χρήστες να εξερευνήσουν οπτικά παρόμοιες εικόνες που προτείνει το API;
- Ποια είναι τα διαφορετικά στοιχεία που παρέχονται στο αντικείμενο απόκρισης της δυνατότητας εντοπισμού ιστού του Google Vision API;
- Πώς βοηθά το χαρακτηριστικό Web Detection στη δημιουργία ετικετών για μεταφορτωμένες εικόνες;
Δείτε περισσότερες ερωτήσεις και απαντήσεις στο EITC/AI/GVAPI Google Vision API