Paano natin makukuha ang landmark na impormasyon mula sa object ng pagtugon sa anotasyon?

by EITCA Academy / Wednesday, 27 2023 Disyembre / Inilathala sa Artipisyal na Talino, EITC/AI/GVAPI Google Vision API, Pag-unawa sa mga advanced na imahe, Pagtuklas ng mga palatandaan, Pagsusuri sa pagsusulit

Para kunin ang landmark na impormasyon mula sa anotation response object sa konteksto ng advanced na mga imahe sa pag-unawa na feature ng Google Vision API para sa pag-detect ng mga landmark, kailangan naming gamitin ang mga nauugnay na field at pamamaraan na ibinigay ng API. Ang object ng pagtugon sa anotasyon ay isang istraktura ng JSON na naglalaman ng iba't ibang mga katangian at halaga na nauugnay sa mga resulta ng pagsusuri ng larawan.

Una, kailangan nating tiyakin na ang imahe ay matagumpay na naproseso ng API at ang object ng tugon ay naglalaman ng kinakailangang impormasyon. Magagawa ito sa pamamagitan ng pagsuri sa field na "status" ng object ng tugon. Kung "OK" ang status, ipinapahiwatig nito na matagumpay ang pagsusuri ng larawan at maaari tayong magpatuloy sa pagkuha ng landmark na impormasyon.

Maaaring ma-access ang landmark na impormasyon mula sa field na "landmarkAnnotations" ng object ng tugon. Ang field na ito ay isang hanay ng mga anotasyon, kung saan ang bawat anotasyon ay kumakatawan sa isang nakitang palatandaan sa larawan. Naglalaman ang bawat landmark na anotasyon ng ilang property, kabilang ang lokasyon, paglalarawan, at marka.

Ang property na "lokasyon" ay nagbibigay ng bounding box coordinates ng nakitang landmark. Tinukoy ng mga coordinate na ito ang posisyon at laki ng landmark sa loob ng larawan. Sa pamamagitan ng pagsusuri sa mga coordinate na ito, matutukoy natin ang eksaktong lokasyon ng landmark.

Ang property na "description" ay nagbibigay ng textual na paglalarawan ng landmark. Maaaring gamitin ang paglalarawang ito upang matukoy ang palatandaan at magbigay ng karagdagang konteksto sa user. Halimbawa, kung na-detect ng API ang Eiffel Tower sa isang larawan, maaaring maglaman ang property ng paglalarawan ng text na "Eiffel Tower."

Kinakatawan ng property na "iskor" ang marka ng kumpiyansa ng API sa pagtukoy sa landmark. Ang markang ito ay isang halaga sa pagitan ng 0 at 1, kung saan ang mas mataas na marka ay nagpapahiwatig ng mas mataas na antas ng kumpiyansa. Sa pamamagitan ng pagsusuri sa markang ito, maaari naming masuri ang pagiging maaasahan ng natukoy na palatandaan.

Upang kunin ang landmark na impormasyon mula sa object ng pagtugon sa anotasyon, maaari naming ulitin ang hanay ng "landmarkAnnotations" at i-access ang mga nauugnay na katangian para sa bawat anotasyon. Pagkatapos ay maaari naming iimbak o iproseso ang impormasyong ito kung kinakailangan para sa karagdagang pagsusuri o pagpapakita.

Narito ang isang halimbawang code snippet sa Python na nagpapakita kung paano i-extract ang landmark na impormasyon mula sa anotation response object gamit ang Google Cloud Vision API client library:

python
from google.cloud import vision

def extract_landmark_info(response):
    if response.status == 'OK':
        for annotation in response.landmark_annotations:
            location = annotation.location
            description = annotation.description
            score = annotation.score

            # Process the landmark information as needed
            print(f"Landmark: {description}")
            print(f"Location: {location}")
            print(f"Score: {score}n")
    else:
        print('Image analysis failed.')

# Assuming you have already authenticated and created a client
client = vision.ImageAnnotatorClient()

# Assuming you have an image file 'image.jpg' to analyze
with open('image.jpg', 'rb') as image_file:
    content = image_file.read()

image = vision.Image(content=content)
response = client.landmark_detection(image=image)
extract_landmark_info(response)

Sa halimbawang ito, kinukuha ng function na `extract_landmark_info` ang object ng tugon ng anotasyon bilang input at umuulit ito sa array ng `landmark_annotations`. Pagkatapos ay kinukuha at ini-print nito ang landmark na impormasyon para sa bawat anotasyon, kasama ang paglalarawan, lokasyon, at marka.

Sa pamamagitan ng pagsunod sa diskarteng ito, maaari naming epektibong i-extract ang landmark na impormasyon mula sa anotation response object na ibinigay ng advanced images understanding feature ng Google Vision API para sa pag-detect ng mga landmark.

Iba pang kamakailang mga tanong at sagot tungkol sa Pag-unawa sa mga advanced na imahe:

Tingnan ang higit pang mga tanong at sagot sa Advanced na pag-unawa sa mga larawan

Higit pang mga tanong at sagot:

Patlang: Artipisyal na Talino
programa: EITC/AI/GVAPI Google Vision API (pumunta sa programa ng sertipikasyon)
Aralin: Pag-unawa sa mga advanced na imahe (pumunta sa kaugnay na aralin)
Paksa: Pagtuklas ng mga palatandaan (pumunta sa kaugnay na paksa)
Pagsusuri sa pagsusulit

Naka-tag sa ilalim ng: Artipisyal na Talino, Google Cloud Vision API, Pagsusuri ng Imahe, JSON, Landmark Detection, Sawa

EITCA Academy

Paano natin makukuha ang landmark na impormasyon mula sa object ng pagtugon sa anotasyon?

Iba pang kamakailang mga tanong at sagot tungkol sa Pag-unawa sa mga advanced na imahe:

Higit pang mga tanong at sagot:

Ang EITCA Academy ay bahagi ng European IT Certification framework

Pagiging karapat-dapat para sa suporta ng EITCA Academy 80% EITCI DSJC Subsidy

EITCA Academy

MAG-LOG SA IYONG ACCOUNT NG EITHER IYONG USERNAME O EMAIL ADDRESS

PILI ANG IYONG MGA DETALYE?

GUMAWA NG ACCOUNT

Paano natin makukuha ang landmark na impormasyon mula sa object ng pagtugon sa anotasyon?

Iba pang kamakailang mga tanong at sagot tungkol sa Pag-unawa sa mga advanced na imahe:

Higit pang mga tanong at sagot:

Pagiging karapat-dapat para sa suporta ng EITCA Academy 80% EITCI DSJC Subsidy