Ang pinangangasiwaan at hindi pinangangasiwaang pag-aaral ay dalawang pangunahing uri ng mga paradigma sa pag-aaral ng machine na nagsisilbi sa mga natatanging layunin batay sa likas na katangian ng data at mga layunin ng gawaing nasa kamay. Ang pag-unawa kung kailan gagamit ng pinangangasiwaang pagsasanay kumpara sa hindi pinangangasiwaang pagsasanay ay mahalaga sa pagdidisenyo ng mga epektibong modelo ng machine learning. Ang pagpili sa pagitan ng dalawang approach na ito ay depende sa availability ng may label na data, ang gustong resulta, at ang pinagbabatayan na istraktura ng dataset.
Ang pinangangasiwaang pag-aaral ay isang uri ng machine learning kung saan ang modelo ay sinanay sa isang may label na dataset. Sa pinangangasiwaang pag-aaral, natututo ang algorithm na imapa ang data ng input sa tamang output sa pamamagitan ng pagpapakita ng mga halimbawa ng pagsasanay. Ang mga halimbawa ng pagsasanay na ito ay binubuo ng mga pares ng input-output, kung saan ang input data ay sinamahan ng kaukulang tamang output o target na halaga. Ang layunin ng pinangangasiwaang pag-aaral ay upang matutunan ang isang mapping function mula sa mga variable ng input hanggang sa mga variable ng output, na pagkatapos ay magagamit upang gumawa ng mga hula sa hindi nakikitang data.
Ang pinangangasiwaang pag-aaral ay karaniwang ginagamit kapag ang nais na output ay alam at ang layunin ay upang malaman ang kaugnayan sa pagitan ng input at output variable. Karaniwang ginagamit ito sa mga gawain tulad ng pag-uuri, kung saan ang layunin ay hulaan ang mga label ng klase ng mga bagong pagkakataon, at regression, kung saan ang layunin ay hulaan ang isang tuluy-tuloy na halaga. Halimbawa, sa isang pinangangasiwaang sitwasyon sa pag-aaral, maaari mong sanayin ang isang modelo upang mahulaan kung ang isang email ay spam o hindi batay sa nilalaman ng email at ang may label na spam/non-spam na katayuan ng mga nakaraang email.
Sa kabilang banda, ang unsupervised learning ay isang uri ng machine learning kung saan ang modelo ay sinanay sa isang walang label na dataset. Sa unsupervised learning, natututo ang algorithm ng mga pattern at istruktura mula sa input data nang walang tahasang feedback sa tamang output. Ang layunin ng hindi pinangangasiwaang pag-aaral ay i-explore ang pinagbabatayan na istraktura ng data, tumuklas ng mga nakatagong pattern, at kumuha ng mga makabuluhang insight nang hindi nangangailangan ng may label na data.
Karaniwang ginagamit ang unsupervised learning kapag ang layunin ay galugarin ang data, hanapin ang mga nakatagong pattern, at pagsama-samahin ang magkakatulad na data point. Madalas itong inilalapat sa mga gawain tulad ng clustering, kung saan ang layunin ay igrupo ang mga katulad na data point sa mga cluster batay sa kanilang mga feature, at pagbawas ng dimensionality, kung saan ang layunin ay bawasan ang bilang ng mga feature habang pinapanatili ang mahahalagang impormasyon sa data. Halimbawa, sa isang hindi pinangangasiwaang senaryo sa pag-aaral, maaari mong gamitin ang clustering upang pagpangkatin ang mga customer batay sa kanilang gawi sa pagbili nang walang anumang paunang kaalaman sa mga segment ng customer.
Ang pagpili sa pagitan ng pinangangasiwaan at hindi pinangangasiwaang pag-aaral ay nakasalalay sa ilang mga salik. Kung mayroon kang naka-label na dataset at gusto mong hulaan ang mga partikular na resulta, ang pinangangasiwaang pag-aaral ang naaangkop na pagpipilian. Sa kabilang banda, kung mayroon kang walang label na dataset at gusto mong i-explore ang istraktura ng data o maghanap ng mga nakatagong pattern, mas angkop ang hindi sinusubaybayang pag-aaral. Sa ilang mga kaso, maaaring gamitin ang kumbinasyon ng parehong pinangangasiwaan at hindi pinangangasiwaang mga diskarte, na kilala bilang semi-supervised na pag-aaral, upang magamit ang mga benepisyo ng parehong mga diskarte.
Ang desisyon na gumamit ng pinangangasiwaang pagsasanay kumpara sa hindi pinangangasiwaang pagsasanay sa machine learning ay nakasalalay sa pagkakaroon ng may label na data, ang katangian ng gawain, at ang gustong resulta. Ang pag-unawa sa mga pagkakaiba sa pagitan ng pinangangasiwaang pag-aaral at hindi pinangangasiwaang pag-aaral ay mahalaga para sa pagdidisenyo ng mga epektibong modelo ng machine learning na maaaring kumuha ng makabuluhang mga insight at gumawa ng mga tumpak na hula mula sa data.
Iba pang kamakailang mga tanong at sagot tungkol sa EITC/AI/GCML Google Cloud Machine Learning:
- Ano ang text to speech (TTS) at kung paano ito gumagana sa AI?
- Ano ang mga limitasyon sa pagtatrabaho sa malalaking dataset sa machine learning?
- Magagawa ba ng machine learning ang ilang dialogic na tulong?
- Ano ang TensorFlow playground?
- Ano ba talaga ang ibig sabihin ng mas malaking dataset?
- Ano ang ilang halimbawa ng mga hyperparameter ng algorithm?
- Ano ang pag-aaral ng ensemble?
- Paano kung ang napiling machine learning algorithm ay hindi angkop at paano makasigurado na piliin ang tama?
- Kailangan ba ng isang machine learning model ang pangangasiwa sa panahon ng pagsasanay nito?
- Ano ang mga pangunahing parameter na ginagamit sa mga algorithm na nakabatay sa neural network?
Tingnan ang higit pang mga tanong at sagot sa EITC/AI/GCML Google Cloud Machine Learning