Ang arkitektura ng neural network na ginamit sa halimbawa ay isang feedforward neural network na may tatlong layer: isang input layer, isang hidden layer, at isang output layer. Ang input layer ay binubuo ng 784 units, na tumutugma sa bilang ng mga pixel sa input image. Ang bawat unit sa input layer ay kumakatawan sa intensity value ng isang pixel sa larawan.
Ang nakatagong layer ay binubuo ng 128 units, na ganap na konektado sa input layer. Ang bawat unit sa nakatagong layer ay kinakalkula ang isang timbang na kabuuan ng mga input mula sa input layer at naglalapat ng isang activation function upang makagawa ng isang output. Sa halimbawang ito, ang activation function na ginagamit sa hidden layer ay ang rectified linear unit (ReLU) function. Ang ReLU function ay tinukoy bilang f(x) = max(0, x), kung saan ang x ay ang timbang na kabuuan ng mga input sa unit. Ang ReLU function ay nagpapakilala ng non-linearity sa network, na nagbibigay-daan dito na matuto ng mga kumplikadong pattern at relasyon sa data.
Ang output layer ay binubuo ng 10 unit, bawat isa ay kumakatawan sa isa sa mga posibleng klase sa problema sa pag-uuri. Ang mga unit sa output layer ay ganap ding konektado sa mga unit sa hidden layer. Katulad ng nakatagong layer, ang bawat unit sa output layer ay kinakalkula ang isang timbang na kabuuan ng mga input mula sa nakatagong layer at naglalapat ng isang activation function. Sa halimbawang ito, ang activation function na ginagamit sa output layer ay ang softmax function. Kino-convert ng softmax function ang weighted sum ng inputs sa probability distribution sa mga klase, kung saan ang sum ng probabilities ay katumbas ng 1. Ang unit na may pinakamataas na probability ay kumakatawan sa hinulaang klase ng input image.
Upang buod, ang neural network architecture na ginamit sa halimbawa ay binubuo ng isang input layer na may 784 units, isang hidden layer na may 128 units gamit ang ReLU activation function, at isang output layer na may 10 units gamit ang softmax activation function.
Iba pang kamakailang mga tanong at sagot tungkol sa Pagbuo ng isang neural network upang maisagawa ang pag-uuri:
- Kailangan bang gumamit ng asynchronous learning function para sa mga machine learning model na tumatakbo sa TensorFlow.js?
- Paano pinagsama-sama at sinanay ang modelo sa TensorFlow.js, at ano ang tungkulin ng categorical cross-entropy loss function?
- Ano ang kahalagahan ng rate ng pagkatuto at bilang ng mga panahon sa proseso ng machine learning?
- Paano nahahati ang data ng pagsasanay sa mga set ng pagsasanay at pagsubok sa TensorFlow.js?
- Ano ang layunin ng TensorFlow.js sa pagbuo ng neural network para sa mga gawain sa pag-uuri?