Overvåget læring i Apache Mahout



Supervised Learning er en teknik til maskinindlæring, hvor en funktion udledes fra de mærkede eksempler på træningsdata.

Supervised Learning er metoden, hvor træningsdataene inkluderer både input og de ønskede resultater. Uddannelse af systemet med eksempler kaldes overvåget læring. Ellers kan træning af algoritmen med en lærer også behandles som overvåget læring. Efter at have trænet algoritmen med alle eksempeldata eller mærkede data, der har begge forudsigerne på målvariablen, kan man træne algoritmen og bruge det usynlige eksempel til yderligere klassificering.





Her er nogle af de vigtige funktioner i Supervised Learning in Mahout:

  • Opbygningen af ​​en ordentlig træning, validering og testsæt (Bok) er afgørende.
  • Disse metoder er normalt hurtige og nøjagtige.
  • De overvågede læringsmetoder skal være i stand til at generalisere.
  • De giver korrekte resultater, når nye data gives i input uden at kende enpriorimål.
  • I nogle tilfælde er de korrekte resultater (mål) kendt og givet i input til modellen under læringsprocessen.

Eksempel på overvåget læring

I tilfælde af at du vil træne en mission, og du får to forskellige grupper af billeder sammen med de mærkede data, f.eks. i ovenstående billede har den ene gruppe billederne af en elefant, og den anden har billederne af en løve. Mærkede data indebærer, at hvert datasæt har en målværdi. I ovenstående eksempel er datasættet billeder af elefant, mens etiketten til det, dvs. 'Elefant' er målværdien af ​​datasættet. Et sådant mærket datasæt bruges til træningsprocessen, så træningsalgoritmen kan udnytte dette datasæt og opbygge en model, som yderligere kan bruges til at klassificere de usete eksempler uden de mærkede data eller målvariabler.



hvad er en parameter i tableauet

Lad os identificere de funktioner, der hjælper med at identificere et objekt som en elefant eller en løve:

transformationer i informatica med eksempel

Funktionerne kunne være - størrelse, farve, højde, ørestørrelse, bagagerum, brosme

Dette kan kaldes et funktionssæt, som vil blive brugt til træningsformålet. Dette funktionssæt vil påvirke den endelige målvariabel. Disse variabler er kendt som forudsigelsesvariabler , fordi de hjælper os med at bestemme endelig målvariabel . Den endelige variabel kan også kaldes en etiket. Den endelige variabel her er elefant / løve.



table-word

I dette eksempel er hver af posterne i kategorierne, størrelse, farve, højde, ørestørrelse, bagagerum og brosme en forudsigelsesvariabel, mens Elephant og Lion er målvariablerne. Disse variabler kan behandles som henholdsvis træningseksempler og træningsdatasæt.

Fibonacci-funktion c ++

Supervised Learning er således en måde, hvorigennem du træner sammen med etiketterne, hvor du beder algoritmen om at udtrække visse funktioner ud af den, og baseret på det, når du ser et uset eksempel, vil algoritmen være i stand til at klassificere det ind i den rigtige klasse.

Har du et spørgsmål til os? Nævn dem i kommentarfeltet, så vender vi tilbage til dig.

Relaterede indlæg: