Hvad er de vigtigste terminologier i Hadoop Security?



Denne Edureka-blog hjælper dig med en detaljeret og omfattende viden om hadoop-sikkerhed, der implementeres i realtid.

er et stort problem, når det gælder håndtering af fortrolige data. at være overlegen i datahåndteringsoperationer står også over for det samme problem. Det har ikke sin egen dedikerede sikkerhed. Lad os forstå, hvordan problemet blev løst gennem dette Hadoop-sikkerhed artikel.

Hvorfor har vi brug for Hadoop Security?

hadoop-sikkerhed-hvorfor er hadoop-sikkerhed vigtig





er den mest kraftfulde, robuste og meget skalerbare rammedatabehandlingsramme, der er i stand til at knuse petabytes af data med lethed. På grund af sine uovertrufne kapaciteter begyndte dengang alle forretningssektorer, sundheds-, militær- og finansafdelinger at bruge Hadoop.

Hadoop begyndte at vinde popularitet. Dette er, når Hadoop-udviklerne fandt en monumental fejlberegning. Hadoop manglede en dedikeret sikkerhedssoftware inde i det. Dette ramte mange områder, hvor Hadoop var i brug.



  • Flere forretningssektorer

  • National sikkerhed

  • Afdelinger for sundhed og medicin



  • Sociale medier

  • Militær

Ovennævnte områder er de største brugere af Hadoop. Nu, Sikkerhed er det største spring, som Hadoop skal tage.

Hvad er Hadoop Security?

Hadoop-sikkerhed er generelt defineret som en procedure til sikker Hadoop Data Storage-enheden ved at tilbyde en næsten uigennemtrængelig mur af sikkerhed mod enhver potentiel cybertrussel. Hadoop opnår denne højkaliber sikkerhedsmur ved at følge nedenstående sikkerhedsprotokol.

Godkendelse

Godkendelse er det første trin, hvor brugerens legitimationsoplysninger verificeres. Oplysningerne inkluderer typisk brugerens dedikerede Brugernavn og en hemmeligt kodeord. Indtastetlegitimationsoplysninger kontrolleres i forhold til de tilgængelige detaljer i sikkerhedsdatabasen. Hvis gyldig, vil brugeren være godkendt.

Bemyndigelse

Bemyndigelse er det andet trin, hvor systemet skal beslutte, om brugeren skal give tilladelse til at få adgang til data eller ej. Den er baseret på den foruddefinerede liste over adgangskontrol. Det fortroligeoplysninger holdes sikre og kun autoriseret personale kan få adgang til det.

hvordan man bruger goto c ++

Revision

Revision er det sidste trin, holder det simpelthen styr på de handlinger, der udføres af den godkendte bruger i den periode, hvor han var logget ind i klyngen. Dette erudelukkende gjort for sikkerhed kun til formål.

Typer af Hadoop-sikkerhed

  • Kerberos sikkerhed

Kerberos er en af ​​de førende netværksgodkendelsesprotokoller designet til at levere kraftfulde godkendelsestjenester til begge Server og Klient-ender igennem Secret-Key kryptografi teknikker. Det er bevist, at det er meget sikkert, da det bruger krypterede servicebilletter gennem hele sessionen.

  • HDFS-kryptering

HDFS-kryptering er en formidabel fremgang, som Hadoop nogensinde omfavnede. Her er dataene fra kilde til destination (HDFS) bliver helt krypteret. Denne procedure kræver ikke, at der foretages ændringer i den oprindelige Hadoop-applikation, hvilket gør klient at være det eneste autoriserede personale til adgang dataene.

  • Trafikkryptering

Trafikkryptering er ingen ringere end HTTPS (HyperText Transfer Protocol Secure). Denne procedure bruges til at sikre dataoverførslen, fra hjemmesiden såvel som dataoverførsel til webstedet . Meget internetbank gateways bruger denne metode til at sikre transaktioner via en Sikkerhedscertifikat

  • HDFS fil- og katalogtilladelser

HDFS-filmappetilladelser arbejde på en simpel måde POSIX format. Det Læs og Skrive tilladelser gives som r og s henholdsvis. Tilladelserne til Superbruger og Klient indstilles forskelligt baseret på filens fortrolighed.

Kerberos

Kerberos er et af de enkleste og sikreste netværk godkendelsesprotokol bruges af Hadoop til dets data- og netværkssikkerhed. Det blev opfundet af MED. Hovedformålet med Kerberos er at eliminere behovet for at udveksle adgangskoder over et netværk og også at sikre netværket mod ethvert potentiale cyber sniffing.

For at forstå Kerberos terminologi skal vi først lære om de komponenter, der er involveret i Kerberos-softwaren.

KDC eller Key Distribution Center er hjertet af Kerberos. Den består hovedsageligt af tre komponenter. Nemlig:

  • Database

Det database gemmer brugeroplysningerne ligesom brugernavn og dens respektive adgangskoder. Det gemmer også adgangsrettigheder leveres til brugeren. Kerberos KDC-enhed gemmer også yderligere oplysninger som f.eks Krypteringsnøgle, billetgyldighed etc.

  • Godkendelsesserver

De indtastede brugeroplysninger bliver krydstjekket. Hvis det er gyldigt, Godkendelsesserver vil forsyne TGT eller Ticket Generation Ticket. En TGT kan kun genereres, hvis brugeren går ind gyldige legitimationsoplysninger.

  • Ticket tildelingsserver

Den næste fase er TGS eller Ticket tildelingsserver. Det er dybest set en applikationsserver fra KDC, som giver dig den Servicebillet. Servicebilletten kræves af brugeren for at interagere med Hadoop og få den service, han har brug for, eller for at udføre en operation på Hadoop.

hvordan man konverterer dobbelt til int

Du kan installere Kerberos ved hjælp af følgende kommando:

sudo apt-get install krb5-kdc krb5-admin-server

Lad os nu antage, at du ønsker at få adgang til en Kerberos-sikret Hadoop-klynge. Du skal gennemgå følgende faser for at få adgang til Hadoop-klyngen som beskrevet i nedenstående trin:

  • Du skal få Godkendelse af Hadoop-klyngen. Du kan blive godkendt ved at udføre Kinit kommando på Hadoop-klyngen.

kinit root / admin
  • Det Kinit Kommandokørsel vil omdirigere dig til Loginoplysninger side, hvor du forventes at indtaste din brugernavn og adgangskode.

  • Det Kinit vil sende en Godkendelsesanmodning til Godkendelsesserver.

  • Hvis dine legitimationsoplysninger er gyldig, derefter svarer Authentication Server med en Ticket Generation Ticket (TGT).

  • Det Kinit gemmer TGT i dine legitimationsoplysninger Cache Hukommelse. Følgende kommando hjælper dig med at læse dine legitimationsoplysninger

klist
  • Nu er du med succes godkendt til KDS.

  • Før du får adgang til Hadoop-klyngen, skal du konfigurere Kerberos-klienter. Brug følgende kommando for at gøre det.

sudo apt-get install krb5-bruger libpam-krb5 libpam-ccreds auth-client-config
  • Nu prøver du at udføre en Hadoop-kommando. Det er en Hadoop-klient.

  • Det Hadoop-klient vil bruge din TGT og anmodninger TGS Til godkendelse.

  • Det TGS vil godkende anmodningen, og den vil give dig en Servicebillet.

  • Dette Servicebillet vil blive cachelagret af Hadoop-klient.

  • Dette Servicebillet vil blive brugt af Hadoop-klienten til kommunikere med Hadoop Namenode.

  • Det Namenode vil identificere sig med sin Billet.

  • Både Namenode-billet og Hadoop-klient Servicebilletter vil blive krydstjekket af hinanden.

    er sas et programmeringssprog
  • Begge er sikre på, at de kommunikerer med en godkendt enhed.

  • Dette kaldes Gensidig godkendelse.

  • Den næste fase er Bemyndigelse. Namenode giver dig service som du har modtaget bemyndigelse.

  • Endelig er den sidste fase Revision. Her din aktivitet vil være logget til sikkerhedsformål.

Med dette kommer vi til slutningen af ​​denne artikel . Jeg håber, at jeg har kastet lys over din viden om en Hadoop-sikkerhed.

Nu hvor du har forstået Hadoop og dets sikkerhed, skal du tjekke af Edureka, et pålideligt online læringsfirma med et netværk på mere end 250.000 tilfredse elever spredt over hele kloden. Edureka Big Data Hadoop-certificeringskursus hjælper elever med at blive ekspert i HDFS, Garn, MapReduce , Pig, Hive, HBase, Oozie, Flume og Sqoop ved hjælp af realtidsbrugssager på detail-, sociale medier, luftfart, turisme, økonomidomæne.

Hvis du har nogen forespørgsler relateret til dette “Hadoop-sikkerhed” artikel, så skriv til os i kommentarfeltet nedenfor, og vi vil svare dig så tidligt som muligt.