Για να εξαγάγετε όλους τους σχολιασμούς αντικειμένων από την απόκριση του API στον τομέα της Τεχνητής Νοημοσύνης – Google Vision API – Προηγμένη κατανόηση εικόνων – Ανίχνευση αντικειμένων, μπορείτε να χρησιμοποιήσετε τη μορφή απόκρισης που παρέχεται από το API, η οποία περιλαμβάνει μια λίστα αντικειμένων που έχουν εντοπιστεί μαζί με τα αντίστοιχα οριοθετημένα κουτιά και βαθμολογίες εμπιστοσύνης. Αναλύοντας αυτήν την απόκριση, μπορείτε να εξαγάγετε τους επιθυμητούς σχολιασμούς αντικειμένων.
Η απόκριση API αποτελείται συνήθως από ένα αντικείμενο JSON που περιέχει διάφορα πεδία, συμπεριλαμβανομένου του πεδίου "localizedObjectAnnotations", το οποίο περιέχει τα αντικείμενα που έχουν εντοπιστεί. Κάθε σχολιασμός αντικειμένου περιλαμβάνει πληροφορίες όπως το όνομα του αντικειμένου, τις συντεταγμένες του πλαισίου οριοθέτησής του και μια βαθμολογία εμπιστοσύνης που υποδεικνύει την εμπιστοσύνη του API στον εντοπισμό.
Για να εξαγάγετε τους σχολιασμούς αντικειμένων, μπορείτε να ακολουθήσετε αυτά τα βήματα:
1. Ανάλυση της απόκρισης API: Ξεκινήστε αναλύοντας την απάντηση JSON που ελήφθη από το API. Αυτό μπορεί να γίνει χρησιμοποιώντας μια βιβλιοθήκη ανάλυσης JSON ή ενσωματωμένες συναρτήσεις που παρέχονται από τη γλώσσα προγραμματισμού σας.
2. Πρόσβαση στο πεδίο "localizedObjectAnnotations": Αφού αναλυθεί η απάντηση, αποκτήστε πρόσβαση στο πεδίο "localizedObjectAnnotations", το οποίο περιέχει τα αντικείμενα που εντοπίστηκαν. Αυτό το πεδίο είναι συνήθως ένας πίνακας σχολιασμών αντικειμένων.
3. Επανάληψη μέσω των σχολιασμών αντικειμένων: Επανάληψη μέσω κάθε σχολιασμού αντικειμένου στον πίνακα. Κάθε σχολιασμός αντιπροσωπεύει ένα αντικείμενο που έχει εντοπιστεί στην εικόνα.
4. Εξαγωγή σχετικών πληροφοριών: Εξάγετε τις σχετικές πληροφορίες από κάθε σχολιασμό αντικειμένου, όπως το όνομα του αντικειμένου, τις συντεταγμένες του πλαισίου οριοθέτησης και τη βαθμολογία εμπιστοσύνης. Αυτές οι λεπτομέρειες μπορούν να προσπελαστούν ως ξεχωριστά πεδία σε κάθε σχολιασμό αντικειμένου.
5. Αποθηκεύστε ή επεξεργαστείτε τις εξαγόμενες πληροφορίες: Ανάλογα με τις απαιτήσεις σας, μπορείτε να αποθηκεύσετε τις εξαγόμενες πληροφορίες σε μια δομή δεδομένων ή να τις επεξεργαστείτε περαιτέρω για ανάλυση ή άλλους σκοπούς. Για παράδειγμα, μπορεί να θέλετε να αποθηκεύσετε τα ονόματα των αντικειμένων και τις αντίστοιχες συντεταγμένες πλαισίου οριοθέτησής τους σε μια βάση δεδομένων ή να τα χρησιμοποιήσετε για περαιτέρω εργασίες κατανόησης εικόνας.
Ακολουθεί ένα απλοποιημένο παράδειγμα για την απεικόνιση της διαδικασίας εξαγωγής:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"mid": "/m/01g317",
"όνομα": "γάτα",
"σκορ": 0.89271355,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
] }
},
{
"mid": "/m/04rky",
"όνομα": "σκύλος",
"σκορ": 0.8132468,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
Σε αυτό το παράδειγμα, υποθέτουμε μια απόκριση JSON που περιέχει δύο ανιχνευμένα αντικείμενα: μια γάτα και έναν σκύλο. Ο κώδικας αναλύει την απόκριση, αποκτά πρόσβαση στο πεδίο "localizedObjectAnnotations", επαναλαμβάνεται μέσω κάθε σχολιασμού αντικειμένου και εξάγει το όνομα του αντικειμένου, τις συντεταγμένες οριοθέτησης πλαισίου και τη βαθμολογία εμπιστοσύνης. Τέλος, εκτυπώνονται οι εξαγόμενες πληροφορίες, αλλά μπορείτε να τροποποιήσετε τον κωδικό ώστε να ταιριάζει στις συγκεκριμένες ανάγκες σας.
Ακολουθώντας αυτά τα βήματα, μπορείτε να εξαγάγετε αποτελεσματικά όλους τους σχολιασμούς αντικειμένων από την απόκριση του API στον τομέα της Τεχνητής Νοημοσύνης – Google Vision API – Προηγμένη κατανόηση εικόνων – Ανίχνευση αντικειμένων.
Άλλες πρόσφατες ερωτήσεις και απαντήσεις σχετικά με Προηγμένη κατανόηση εικόνων:
- Ποιες είναι μερικές προκαθορισμένες κατηγορίες για την αναγνώριση αντικειμένων στο Google Vision API;
- Ποια είναι η συνιστώμενη προσέγγιση για τη χρήση της δυνατότητας ανίχνευσης ασφαλούς αναζήτησης σε συνδυασμό με άλλες τεχνικές εποπτείας;
- Πώς μπορούμε να έχουμε πρόσβαση και να εμφανίζουμε τις τιμές πιθανότητας για κάθε κατηγορία στον σχολιασμό ασφαλούς αναζήτησης;
- Πώς μπορούμε να αποκτήσουμε τον σχολιασμό ασφαλούς αναζήτησης χρησιμοποιώντας το Google Vision API στην Python;
- Ποιες είναι οι πέντε κατηγορίες που περιλαμβάνονται στη λειτουργία ανίχνευσης ασφαλούς αναζήτησης;
- Πώς εντοπίζει η λειτουργία ασφαλούς αναζήτησης του Google Vision API άσεμνο περιεχόμενο εντός εικόνων;
- Πώς μπορούμε να αναγνωρίσουμε οπτικά και να επισημάνουμε τα αντικείμενα που εντοπίστηκαν σε μια εικόνα χρησιμοποιώντας τη βιβλιοθήκη μαξιλαριού;
- Πώς μπορούμε να οργανώσουμε τις πληροφορίες του εξαγόμενου αντικειμένου σε μορφή πίνακα χρησιμοποιώντας το πλαίσιο δεδομένων pandas;
- Ποιες βιβλιοθήκες και ποιες γλώσσες προγραμματισμού χρησιμοποιούνται για την επίδειξη της λειτουργικότητας του Google Vision API;
- Πώς το Google Vision API εκτελεί τον εντοπισμό και τον εντοπισμό αντικειμένων στις εικόνες;
Δείτε περισσότερες ερωτήσεις και απαντήσεις στο Σύνθετη κατανόηση εικόνων