Ang isang may label na data, sa konteksto ng Artificial Intelligence (AI) at partikular sa domain ng Google Cloud Machine Learning, ay tumutukoy sa isang dataset na na-annotate o minarkahan ng mga partikular na label o kategorya. Ang mga label na ito ay nagsisilbing ground truth o reference para sa pagsasanay ng mga algorithm ng machine learning. Sa pamamagitan ng pag-uugnay ng mga punto ng data sa mga kaukulang label ng mga ito, matututunan ng machine learning model na kilalanin ang mga pattern at gumawa ng mga hula batay sa bago at hindi nakikitang data.
Ang may label na data ay gumaganap ng isang mahalagang papel sa pinangangasiwaang pag-aaral, na isang karaniwang diskarte sa machine learning. Sa pinangangasiwaang pag-aaral, ang modelo ay sinanay sa isang naka-label na dataset upang matutunan ang kaugnayan sa pagitan ng mga feature ng pag-input at ng kanilang mga katumbas na label ng output. Ang proseso ng pagsasanay na ito ay nagpapahintulot sa modelo na gawing pangkalahatan ang kaalaman nito at gumawa ng mga tumpak na hula sa bago, hindi nakikitang data.
Upang ilarawan ang konseptong ito, isaalang-alang natin ang isang halimbawa ng isang gawain sa pag-aaral ng makina sa larangan ng pagkilala ng imahe. Ipagpalagay na gusto naming bumuo ng isang modelo na maaaring mag-uri-uriin ang mga larawan ng mga hayop sa iba't ibang kategorya tulad ng mga pusa, aso, at ibon. Kakailanganin namin ang isang naka-label na dataset kung saan nauugnay ang bawat larawan sa tamang label nito. Halimbawa, ang isang imahe ng isang pusa ay lalagyan ng label bilang "pusa," isang imahe ng isang aso bilang "aso," at iba pa.
Ang may label na dataset ay bubuo ng isang koleksyon ng mga larawan at ang kanilang mga kaukulang label. Ang bawat larawan ay kakatawanin ng isang hanay ng mga tampok, tulad ng mga halaga ng pixel o mas mataas na antas na mga representasyon na nakuha mula sa larawan. Ang mga label ay magsasaad ng tamang kategorya o klase kung saan kabilang ang bawat larawan.
Sa yugto ng pagsasanay, ipapakita ang modelo ng machine learning na may label na dataset. Matututunan nitong tukuyin ang mga pattern at relasyon sa pagitan ng mga feature ng pag-input at ng kaukulang mga label. I-a-update ng modelo ang mga panloob na parameter nito upang mabawasan ang pagkakaiba sa pagitan ng mga hula nito at ng mga totoong label sa data ng pagsasanay.
Kapag nasanay na ang modelo, maaari itong magamit upang gumawa ng mga hula sa mga bago at hindi nakikitang larawan. Dahil sa isang walang label na larawan, susuriin ng modelo ang mga feature nito at hulaan ang pinakamalamang na label batay sa natutunan nitong kaalaman mula sa may label na dataset. Halimbawa, kung hinuhulaan ng modelo na ang isang imahe ay naglalaman ng isang pusa, nangangahulugan ito na ito ay may mga kinikilalang pattern sa larawan na nagpapahiwatig ng isang pusa.
Ang naka-label na data ay isang pangunahing bahagi sa pagsasanay ng mga modelo ng machine learning. Nagbibigay ito ng kinakailangang impormasyon para matuto ang modelo at makagawa ng mga tumpak na hula. Sa pamamagitan ng pag-uugnay ng mga punto ng data sa mga kaukulang label ng mga ito, matututunan ng modelo na kilalanin ang mga pattern at gawing pangkalahatan ang kaalaman nito sa hindi nakikitang data.
Iba pang kamakailang mga tanong at sagot tungkol sa EITC/AI/GCML Google Cloud Machine Learning:
- Ano ang text to speech (TTS) at kung paano ito gumagana sa AI?
- Ano ang mga limitasyon sa pagtatrabaho sa malalaking dataset sa machine learning?
- Magagawa ba ng machine learning ang ilang dialogic na tulong?
- Ano ang TensorFlow playground?
- Ano ba talaga ang ibig sabihin ng mas malaking dataset?
- Ano ang ilang halimbawa ng mga hyperparameter ng algorithm?
- Ano ang pag-aaral ng ensemble?
- Paano kung ang napiling machine learning algorithm ay hindi angkop at paano makasigurado na piliin ang tama?
- Kailangan ba ng isang machine learning model ang pangangasiwa sa panahon ng pagsasanay nito?
- Ano ang mga pangunahing parameter na ginagamit sa mga algorithm na nakabatay sa neural network?
Tingnan ang higit pang mga tanong at sagot sa EITC/AI/GCML Google Cloud Machine Learning