4 praktiske grunde til at lære Hadoop 2.0



Disse 4 grunde til at opgradere til Hadoop 2.0 taler om Hadoop-jobmarkedet, og hvordan det kan hjælpe dig med at fremskynde din karriere ved at gøre dig åben for enorme jobmuligheder.

Da jeg var yngre, elskede jeg Star Wars-filmserien. Jeg elskede det så meget, at jeg havde denne videokassette af hver eneste af dem. Jeg plejede at se dem igen og igen. Så kom DVD-afspillerens tid, og jeg måtte få disse film igen på DVD. Jeg havde ingen problemer med at købe hele sættet igen på DVD, da jeg også gerne ville opleve den nye teknologi og fortsætte med at nyde mine yndlingsfilm. Ting var gode, indtil en anden ny teknologi, Blu-ray opstod. Efter at have købt filmene allerede to gange så jeg ikke frem til at købe dem igen. I nogen tid anstrengte jeg mig ikke for at 'opdatere' mig selv og tænkte, at jeg ville klare mig fint uden denne teknologi. Og jeg klarede mig fint. Det påvirkede ikke mit liv alligevel. Men jeg kunne se en trendændring og kunne ikke dele mine film med mine venner, som de gjorde med hinanden. Jeg følte mig virkelig udeladt.





Endelig gik jeg ud og hentede filmen i Blu-ray. Jeg kan ikke huske det, fordi jeg elsker filmen, men på grund af det faktum, at kvaliteten af ​​videoen var tankegang. Og til tops det hele fik jeg hele filmsættet på en enkelt Blu-ray-disk.

Behovet eller trangen til at holde sig opdateret er stærkest, når det kommer til vores erhverv, da risikoen er større. Det er blevet vigtigt at holde sig på toppen af ​​dit spil.



4 praktiske grunde til at lære Hadoop 2.0:

Så uundgåeligt det kan være, er det at blive opdateret i vores profession blevet en vigtig del af vores liv. Så skræmmende som det måske lyder, er der ikke behov for at blive foruroliget, da teknologier ikke rigtig ændrer sig så hurtigt eller drastisk. Men samtalerne og oplysningerne om disse teknologier og de ting, vi kan gøre med dem, får synlighed. Her er nogle grunde til, at du skal holde dig opdateret:

# 1: Bliv ikke fanget ud

Årsager til at lære Hadoop 2.0



Ikke at være opmærksom på den nyeste opdatering i en teknologi kan få dig til at ligne et rådyr fanget i en forlygte. Ikke ligefrem et strålende billede af dine professionelle evner. At være opdateret får dig til at respekteres af dine jævnaldrende for dine professionelle færdigheder. Der er muligvis ikke behov for at implementere alle nye ting, du lærer, men det er bydende nødvendigt at være opmærksom på opdateringerne.

For eksempel, når der er en tale om Hadoop, kan du fortælle dine jævnaldrende, at Hadoop 2.5.0 har godkendelsesforbedringer, når du bruger en HTTP-proxyserver. Og også i den samme version af Hadoop er der mulighed for at skrive direkte til Graphite.

Det bliver vigtigt at være med på de seneste opdateringer, når organisationer overvejer at migrere til Hadoop. Og 'at kende' kan gøre en enorm forskel for din karriere.

# 2: At have en konkurrencedygtig kant

Professionelle, der er dygtige inden for deres områder, respekteres. Og det at være opdateret er den bedste måde at være på toppen. Dit behov for at holde dig opdateret afspejler din passion for dit job. Ved at udvikle ekspertise i dit job og din branche får du tillid og respekt for de mennesker omkring dig. Fra et lederskabsperspektiv er dette uvurderligt!

Selvom din organisation stadig arbejder med Hadoop 1.0, vil kendskab til alle de nyeste funktioner i Hadoop 2 holde dig på sporet, da det er relativt nyt og bestemt bedre. At være den første til at lære dette ville give dig en fordel i forhold til dine jævnaldrende.

# 3: Nye muligheder

Det er en trist virkelighed, at vores nuværende rolle bliver ved med at ændre sig. Med tiden kommer tilføjede ansvar og muligheder for at udføre nye opgaver. Ved at holde dig opdateret om branchetrends er du i den bedste position til at udnytte disse muligheder.

Virksomheder som Macy's, Lockheed Martin, California Creative Solutions, Capital One, CSpring, CACI International Inc., Oracle, Yahoo !, American Express, BlueHawk, Aetna, Lawrence Livermore National Laboratory og mange flere er på udkig efter folk, der er dygtige i de nyeste funktioner i Hadoop 2, ligesom GARN.

# 4: Lav bedre beslutninger

De ekstra oplysninger giver dig mulighed for at træffe informerede valg og bedre beslutninger. Det hjælper dig med at genkende muligheder og tilføje værdi til din organisations strategi.

Hadoop 2 har funktioner, der forbedrer hastigheden samt reducerer omkostningerne. Forslag til muligheder for at forbedre ydeevne og øge hastigheden kan helt sikkert øge organisationens produktivitet. Her er nogle funktioner i Hadoop 2, der vil være til gavn for organisationen og foreslå, at de også øger din karriere.

  • Støtte til at køre Hadoop på Microsoft Windows

  • Forenklet distribution af MapReduce-binære filer via HDFS i YARN Distribueret cache.

  • Forbedret support til nye applikationer på YARN med Application History Server og Application Timeline Server

  • Komplet HTTPS support i HDFS

  • Kerberos-integration til YARNs tidslinjebutik.

  • Understøttelse af heterogent lagerhierarki i HDFS.

  • In-memory cache til HDFS-data med centraliseret administration og administration.

  • Forenklet distribution af MapReduce-binære filer via HDFS i YARN Distribueret cache.

Der er mere end bare praktiske grunde til at holde sig opdateret. Der er også tekniske grunde. Hadoop har adskillige funktioner, der er fordelagtige for organisationerne. Hvis du tager et dybtgående kig på dem, får du et klart billede af, hvad de fordelagtige er.

Hvad er den seneste opdatering i Hadoop?

Hvert produkt gennemgår forskellige faser af udgivelser og kommer med forskellige versioner af sig selv. Hadoop er ingen undtagelse og er kommet med Hadoop 2.0. Apache-fundamentet er kommet med efterfølgende versioner af Hadoop som Hadoop 2.1.0, Hadoop 2.4.0 og har nået Hadoop 2.5.1, som er den seneste version, der blev udgivet i september 2014.

Hvorfor blev Hadoop 2 frigivet?

Med den nye version kommer tilføjede funktioner og faste fejl. Så hver gang du bruger en bestemt version af Hadoop og tror, ​​at en bestemt funktion kan tilføjes, eller der skal rettes nogle fejl, skal du lade fyrene på Apache foundation vide om det. Disse fyre arbejder igen på det og giver dig et bedre produkt i den næste version.

Hadoop 2 - ikke bare et tal

Hadoop 2 er ikke kun den nyeste version af Hadoop. I det store og hele er det en anden generations arkitektur. Arun Murthy, grundlægger og arkitekt hos Hadoop-distributør Hortonworks, insisterer på, at forskellen er vigtig, fordi mængden af ​​genudvikling, der kræves for at flytte Hadoop ud over batchbehandling og ind i realtidsanalyseverdenen, har været betydelig.

Lad os diskutere, hvor forskellig Hadoop 2.0 er fra sin forgænger Hadoop 1.0. Det er klart, at den senere udgivne version vil være bedre end den tidligere udgivelse. Følgende er de fire store forbedringer i Hadoop 2.0 i forhold til Hadoop 1.x:

  • HDFS Federation - Vandret skalerbarhed af NameNode

  • NameNode høj tilgængelighed - NameNode er ikke længere et enkelt fejlpunkt

  • GARN - Evne til at behandle Terabyte og Petabyte data tilgængelige i HDFS ved hjælp af applikationer, der ikke er MapReduce, såsom MPI, GIRAPH

  • Ressource Manager - Opdeler de to store funktioner i overbelastet JobTracker (ressourcehåndtering og jobplanlægning / overvågning) i to separate dæmoner: en global Resource Manager og ApplicationMaster pr. Applikation

Der er yderligere funktioner såsom kapacitetsplanlægger (Aktiver understøttelse af flere lejeboliger i Hadoop), Data Snapshot, Support til Windows, NFS-adgang, hvilket muliggør øget Hadoop-adoption i branchen til at løse Big Data-problemer.

Hadoop 2.X vs Hadoop 1.X

Lad os lave en lille sammenligning og se på hvilke måder Hadoop 2.0 er bedre og forskellig fra Hadoop 1.0

Hvorfor foretrækkes Hadoop 2 frem for Hadoop 1.0?

Hadoop 2.0 tilbyder ydelsesforbedringer, der gavner relaterede teknologier i Hadoop-økosystemet. Udover de banebrydende funktioner i HDFS og anden generationens arkitektur (YARN) er der endnu flere og større grunde til at foretrække Hadoop 2 fremfor Hadoop 1.0:

  • Hadoop 2 har ikke længere sprogbegrænsning. Det betyder, at en bred vifte af fagfolk nu kan bruge Hadoop.

  • Med Hadoop 2 overvindes forhindringer som mangel på MapReduce-kodere.

  • 2 gange hurtigere end Hadoop 1.0

  • 2 gange ROI med eksisterende hardware.

  • Med YARN er applikationsprogrammeringsgrænsefladen meget mere åben og fleksibel.

  • Hadoop 2 udvider mulighederne for at bruge Hadoop i Big Data-projekter.

  • Med Hadoop 2 kan udviklere nu udføre et stort udvalg af dataknusende opgaver ud over Hadoops tidligere rækkevidde af batchbehandling.

  • Tilbyder nye muligheder for informationsledere og afhjælper mangler i tidligere versioner.

  • Denne nye udgivelse har den unikke funktion at køre flere arbejdsbelastninger på den samme Hadoop-klynge.

  • Hadoop er ikke længere begrænset til en funktion. Dens anvendelse strækker sig nu ud over HDFS og MapReduce.

Vigtigste fordele ved garn

Vi er opmærksomme på, at GARN er en anden generations arkitektur, lad os se, hvad der gør det så godt.

  • vægt

  • Nye programmeringsmodeller og -tjenester

  • Forbedret brug af klynger

  • Adræthed

  • Meget mere end Java

  • Og mange flere

Efterspørgsel efter Hadoop 2-færdigheder

Organisationer lancerer eller eksperimenterer nu med Hadoop 2. Derfor kommer der et behov for fagfolk, der er dygtige i Hadoop 2. Mange organisationer er allerede begyndt at lede internt efter folk til at arbejde med Hadoop. Der er klare indikationer på, at GARN er stigende og i sidste ende vil erstatte efterspørgslen efter MapReduce-færdigheder.

Her er nogle synspunkter på den nuværende og forventede efterspørgsel efter Hadoop-færdigheder:

  • Ifølge analytikere fra Gartner er Hadoop 2 en vigtig udvikling, da store virksomheder over hele kloden har fundet Hadoop som en spilskifter i deres Big Data-styring.

    hvordan man opretter en app i salesforce
  • Ifølge Eric Kavanagh fra Bloor-gruppen har Hadoop 2.0 fået trækkraft blandt informationsarbejdere, der søger at kæmpe for Big Data.

  • Adoption af Hadoop 2.0 fortsætter med at stige og går nu ind i modenhedsstadiet.

  • Organisationer er opmærksomme på fordelene ved garn og er begejstrede for det.

Her er et øjebliksbillede af ledige stillinger til Hadoop 2.0 / YARN i Indeed.com

Hvem flytter til Hadoop 2 eller har allerede?

Yahoo:

Yahoo! , lederen i alt Hadoop har implementeret GARN (0,23.x). Ifølge Murthy behandler Yahoos 35.000-node-klynge nu 130-150 job om dagen sammenlignet med 50-60 forud for YARN.

Når vi taler om den fantastiske præstation, citerer Murthy: 'Når du har 2x over 35.000 til 40.000 noder, er det fænomenalt'. Han tilføjede også: 'Det er en temmelig overbevisende historie at fortælle en CIO, at hvis du bare opgraderer din software fra Hadoop 1 til Hadoop 2, vil du se 2 gange forbedring af kapacitet i dine job.'

eBay:

eBay har en af ​​de største Hadoop-klynger i branchen, hvor dataene findes i petabyte. De har også migreret deres klynger til Hadoop 2.

Konklusion:

Da Hadoop 2 er moden og lettere at implementere, overbeviser de endda skeptikerne, og flere og flere organisationer migrerer til Hadoop 2.0. Der er gyldige grunde til at undgå 1.x-versionerne. Men med Hadoop 2 overvejer selv de vantro det, da det kan bruges til en bred vifte af anvendelser. Når du lærer Hadoop 2.0 og implementerer det til at udføre beregninger på Big Data, åbner du portene til en teknisk avanceret og økonomisk givende karriere.

Har du et spørgsmål til os? Nævn dem i kommentarfeltet, så vender vi tilbage til dig.

Relaterede indlæg:

Hvor vigtigt er Hadoop-træning?