Πώς μπορείτε να εξαγάγετε ετικέτες από εικόνες χρησιμοποιώντας την Python και το Vision API;

by Ακαδημία EITCA / Τετάρτη, 27 2023 Δεκέμβριο / Δημοσιεύθηκε στο Τεχνητή νοημοσύνη, EITC/AI/GVAPI Google Vision API, Επισήμανση εικόνων, Ανίχνευση ετικετών, Ανασκόπηση εξέτασης

Για να εξαγάγετε μέσω προγραμματισμού ετικέτες από εικόνες χρησιμοποιώντας Python και το Vision API, μπορείτε να αξιοποιήσετε τις ισχυρές δυνατότητες του Google Cloud Vision API. Το Vision API παρέχει ένα ολοκληρωμένο σύνολο λειτουργιών ανάλυσης εικόνων, συμπεριλαμβανομένης της ανίχνευσης ετικετών, που σας επιτρέπει να αναγνωρίζετε αυτόματα και να εξάγετε ετικέτες από εικόνες.

Για να ξεκινήσετε, θα χρειαστεί να ρυθμίσετε ένα έργο Google Cloud και να ενεργοποιήσετε το Vision API. Αφού το κάνετε αυτό, μπορείτε να εγκαταστήσετε τις απαιτούμενες βιβλιοθήκες Python εκτελώντας την ακόλουθη εντολή:

python
pip install google-cloud-vision

Στη συνέχεια, πρέπει να ελέγξετε την ταυτότητα της εφαρμογής σας για να αποκτήσετε πρόσβαση στο Vision API. Μπορείτε να το κάνετε αυτό δημιουργώντας ένα κλειδί λογαριασμού υπηρεσίας και ρυθμίζοντας τη μεταβλητή περιβάλλοντος «GOOGLE_APPLICATION_CREDENTIALS» ώστε να δείχνει τη διαδρομή του αρχείου κλειδιού. Αυτό μπορεί να γίνει χρησιμοποιώντας τον ακόλουθο κώδικα:

python
import os
from google.cloud import vision

os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'

Τώρα, μπορείτε να χρησιμοποιήσετε το Vision API για εξαγωγή ετικετών από εικόνες μέσω προγραμματισμού. Το ακόλουθο απόσπασμα κώδικα δείχνει πώς να το κάνετε αυτό:

python
def extract_labels(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)
    response = client.label_detection(image=image)
    labels = response.label_annotations

    extracted_labels = [label.description for label in labels]

    return extracted_labels

Σε αυτόν τον κώδικα, δημιουργούμε πρώτα μια παρουσία της κλάσης «ImageAnnotatorClient» από τη βιβλιοθήκη «google.cloud.vision». Στη συνέχεια διαβάζουμε το αρχείο εικόνας, δημιουργούμε ένα αντικείμενο «Εικόνα» από το περιεχόμενο του αρχείου και το στέλνουμε στο Vision API για ανίχνευση ετικετών. Η απάντηση API περιέχει μια λίστα με σχολιασμούς ετικετών, από την οποία εξάγουμε τις περιγραφές των ετικετών.

Τώρα μπορείτε να καλέσετε τη συνάρτηση «extract_labels» περνώντας τη διαδρομή προς το αρχείο εικόνας που θέλετε να αναλύσετε. Θα επιστρέψει μια λίστα ετικετών που έχουν εξαχθεί από την εικόνα.

python
image_path = '/path/to/image.jpg'
labels = extract_labels(image_path)
print(labels)

Αυτό θα εξάγει τις εξαγόμενες ετικέτες από την εικόνα.

plaintext
['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']

Το Vision API χρησιμοποιεί προηγμένα μοντέλα μηχανικής εκμάθησης για την ανάλυση εικόνων και τον εντοπισμό αντικειμένων, σκηνών και άλλων οπτικών χαρακτηριστικών. Μπορεί να ανιχνεύσει με ακρίβεια ένα ευρύ φάσμα ετικετών, καθιστώντας το πολύτιμο εργαλείο για διάφορες εφαρμογές όπως ταξινόμηση εικόνων, εποπτεία περιεχομένου και οπτική αναζήτηση.

Για να εξαγάγετε μέσω προγραμματισμού ετικέτες από εικόνες χρησιμοποιώντας Python και το Vision API, πρέπει να ρυθμίσετε ένα έργο Google Cloud, να ενεργοποιήσετε το Vision API, να εγκαταστήσετε τις απαιτούμενες βιβλιοθήκες Python, να ελέγξετε την ταυτότητα της εφαρμογής σας και, στη συνέχεια, να χρησιμοποιήσετε το Vision API για να εκτελέσετε ανίχνευση ετικετών στο εικόνες. Οι εξαγόμενες ετικέτες μπορούν να χρησιμοποιηθούν για περαιτέρω ανάλυση ή για βελτίωση της κατανόησης του περιεχομένου της εικόνας.

Άλλες πρόσφατες ερωτήσεις και απαντήσεις σχετικά με EITC/AI/GVAPI Google Vision API:

Δείτε περισσότερες ερωτήσεις και απαντήσεις στο EITC/AI/GVAPI Google Vision API

Περισσότερες ερωτήσεις και απαντήσεις:

Πεδίο: Τεχνητή νοημοσύνη
πρόγραμμα: EITC/AI/GVAPI Google Vision API (μεταβείτε στο πρόγραμμα πιστοποίησης)
Μάθημα: Επισήμανση εικόνων (πηγαίνετε στο σχετικό μάθημα)
Θέμα: Ανίχνευση ετικετών (μεταβείτε σε σχετικό θέμα)
Ανασκόπηση εξέτασης

Κατηγορίες: Τεχνητή νοημοσύνη, Google Cloud, Ανάλυση εικόνας, Ανίχνευση ετικέτας, Python, Vision API

Ακαδημία EITCA

Πώς μπορείτε να εξαγάγετε ετικέτες από εικόνες χρησιμοποιώντας την Python και το Vision API;

Άλλες πρόσφατες ερωτήσεις και απαντήσεις σχετικά με EITC/AI/GVAPI Google Vision API:

Περισσότερες ερωτήσεις και απαντήσεις:

Η Ακαδημία EITCA αποτελεί μέρος του Ευρωπαϊκού Πλαισίου Πιστοποίησης Πληροφορικής

Επιλεξιμότητα για EITCA Academy 80% EITCI DSJC Υποστήριξη επιδότησης

Ακαδημία EITCA

Συνδεθείτε στον λογαριασμό σας με διαφορετικό όνομα χρήστη ή διεύθυνση ηλεκτρονικού ταχυδρομείου

ΑΠΑΓΟΡΕΥΕΤΕ ΤΑ ΣΤΟΙΧΕΙΑ ΣΑΣ;

ΔΗΜΙΟΥΡΓΊΑ ΛΟΓΑΡΙΑΣΜΟΎ

Πώς μπορείτε να εξαγάγετε ετικέτες από εικόνες χρησιμοποιώντας την Python και το Vision API;

Άλλες πρόσφατες ερωτήσεις και απαντήσεις σχετικά με EITC/AI/GVAPI Google Vision API:

Περισσότερες ερωτήσεις και απαντήσεις:

Επιλεξιμότητα για EITCA Academy 80% EITCI DSJC Υποστήριξη επιδότησης