La classificazione nel Machine Learning

Nel machine learning la classificazione (classification) è un problema che consiste nell'identificare a quale categoria appartiene un elemento in input, sulla base di un modello di classificazione ottenuto in apprendimento automatico.

Esempio. Un esempio tipico di classificazione è l'assegnazione di una email alla classe spam o non spam.

Ogni oggetto/elemento osservato è detto (istanza).

L'algoritmo che implementa la classificazione è detto classificatore (classifier).

Il classificatore esamina l'istanza e la etichetta con una classe.

Nota. Quando le classi sono soltanto due (es. spam/no-spam) si parla di classificazione binomiale o classificazione binaria. Se le classi sono più di due si parla di classificazione multiclasse (multiclass classification o multinomial).

Gli algoritmi della classification

In genere il modello di classificazione è ottenuto istruendo la macchina tramite l'apprendimento supervisionato ( Supervised ML ) tramite un dataset di training contenente degli esempi classificati correttamente.

La classificazione può comunque essere realizzata anche tramite tecniche di apprendimento non supervisionate ( Unsupervised ML ).

Esempio. Un algoritmo di clustering raggruppa i dati in base alla somiglianza o alla distanza. E' un esempio di classificazione tramite apprendimento non supervisionato.

Gli algoritmi di classificazione possono essere lineari o non lineari.

  • Classificazione lineare
    Il confine di separazione delle classi è una retta o un piano.
  • Classificazione non lineare
    Il confine di separazione delle classi è una curva

Nota. In genere gli algoritmi di addestramento basati sulla classificazione lineare risentono del problema dell'underfitting. In compenso sono semplici e veloci. Gli algoritmi basati sulla classificazione non lineari hanno il problema dell'overfitting ossia di eccessivo adattamento ai dati di training.

 
 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin