Upang kunin ang lahat ng anotasyon ng object mula sa tugon ng API sa larangan ng Artificial Intelligence – Google Vision API – Advanced na pag-unawa sa mga larawan – Pag-detect ng mga bagay, maaari mong gamitin ang format ng pagtugon na ibinigay ng API, na kinabibilangan ng listahan ng mga natukoy na bagay kasama ng kanilang katumbas mga bounding box at mga marka ng kumpiyansa. Sa pamamagitan ng pag-parse ng tugon na ito, maaari mong kunin ang nais na anotasyon ng bagay.
Ang tugon ng API ay karaniwang binubuo ng isang JSON object na naglalaman ng iba't ibang field, kabilang ang field na "localizedObjectAnnotations", na naglalaman ng mga nakitang object. Kasama sa bawat anotasyon ng object ang impormasyon gaya ng pangalan ng object, mga coordinate ng bounding box nito, at isang marka ng kumpiyansa na nagsasaad ng kumpiyansa ng API sa pagtuklas.
Upang kunin ang mga anotasyon ng bagay, maaari mong sundin ang mga hakbang na ito:
1. I-parse ang tugon ng API: Magsimula sa pamamagitan ng pag-parse sa tugon ng JSON na natanggap mula sa API. Magagawa ito gamit ang JSON parsing library o mga built-in na function na ibinigay ng iyong programming language.
2. I-access ang field na "localizedObjectAnnotations": Kapag na-parse na ang tugon, i-access ang field na "localizedObjectAnnotations", na naglalaman ng mga nakitang bagay. Ang field na ito ay karaniwang isang hanay ng mga anotasyon ng bagay.
3. Ulitin sa pamamagitan ng mga anotasyon ng bagay: Ulitin sa bawat anotasyon ng bagay sa array. Ang bawat anotasyon ay kumakatawan sa isang nakitang bagay sa larawan.
4. I-extract ang may-katuturang impormasyon: I-extract ang may-katuturang impormasyon mula sa bawat anotasyon ng bagay, tulad ng pangalan ng bagay, mga coordinate ng bounding box, at marka ng kumpiyansa. Maaaring ma-access ang mga detalyeng ito bilang magkahiwalay na mga field sa loob ng bawat anotasyon ng object.
5. Itago o iproseso ang nakuhang impormasyon: Depende sa iyong mga kinakailangan, maaari mong iimbak ang nakuhang impormasyon sa isang istraktura ng data o iproseso pa ito para sa pagsusuri o iba pang layunin. Halimbawa, maaaring gusto mong iimbak ang mga pangalan ng bagay at ang kanilang kaukulang mga coordinate ng bounding box sa isang database o gamitin ang mga ito para sa karagdagang mga gawain sa pag-unawa sa imahe.
Narito ang isang pinasimpleng halimbawa upang ilarawan ang proseso ng pagkuha:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"kalagitnaan": "/m/01g317",
"pangalan": "pusa",
"iskor": 0.89271355,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
] }
},
{
"mid": "/m/04rky",
"pangalan": "aso",
"iskor": 0.8132468,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
Sa halimbawang ito, ipinapalagay namin ang isang tugon ng JSON na naglalaman ng dalawang natukoy na bagay: isang pusa at isang aso. Pina-parse ng code ang tugon, ina-access ang field na "localizedObjectAnnotations", umuulit sa bawat anotasyon ng object, at kinukuha ang pangalan ng object, mga coordinate ng bounding box, at marka ng kumpiyansa. Sa wakas, ang nakuhang impormasyon ay naka-print, ngunit maaari mong baguhin ang code upang umangkop sa iyong mga partikular na pangangailangan.
Sa pamamagitan ng pagsunod sa mga hakbang na ito, maaari mong epektibong i-extract ang lahat ng object annotation mula sa tugon ng API sa larangan ng Artificial Intelligence – Google Vision API – Advanced na pag-unawa sa mga larawan – Objects detection.
Iba pang kamakailang mga tanong at sagot tungkol sa Pag-unawa sa mga advanced na imahe:
- Ano ang ilang mga paunang natukoy na kategorya para sa pagkilala ng bagay sa Google Vision API?
- Ano ang inirerekumendang diskarte para sa paggamit ng ligtas na tampok sa pagtuklas ng paghahanap kasama ng iba pang mga diskarte sa pag-moderate?
- Paano natin maa-access at maipapakita ang mga halaga ng posibilidad para sa bawat kategorya sa ligtas na anotasyon sa paghahanap?
- Paano natin makukuha ang ligtas na anotasyon sa paghahanap gamit ang Google Vision API sa Python?
- Ano ang limang kategorya na kasama sa tampok na pagtukoy ng ligtas na paghahanap?
- Paano nakikita ng ligtas na tampok sa paghahanap ng Google Vision API ang tahasang nilalaman sa loob ng mga larawan?
- Paano natin makikita at mai-highlight ang mga nakitang bagay sa isang imahe gamit ang pillow library?
- Paano natin maaayos ang nakuhang impormasyon ng bagay sa isang tabular na format gamit ang pandas data frame?
- Anong mga library at programming language ang ginagamit upang ipakita ang functionality ng Google Vision API?
- Paano gumaganap ang Google Vision API ng object detection at localization sa mga larawan?
Tingnan ang higit pang mga tanong at sagot sa Advanced na pag-unawa sa mga larawan