Descrizione del dataset

(DA QUA E' UN'IDEA DI UN EVENTUALE GITBOOK)

Possiamo sin da subito notare che si verifica il fenomeno di oversampling, cioè la maggiorparte delle osservazioni ricadono nelle classi target 5 e 6.

Risolveremo questo problema andando a raggruppare le variabili da prevedere in 'qualità bassa', 'qualità media' e 'qualità alta'.

PreviousGIT HUB DEL PROGETTO NextCorrelazioni tra le feature

Last updated 6 days ago