Big Data

Spark vs Hadoop: Hvilken er den bedste Big Data Framework?

Dette blogindlæg taler om apache gnist vs hadoop. Det giver dig en idé om, hvilken ret Big Data-ramme du kan vælge i forskellige scenarier.

Kørsel af Scala-applikation i formørkelse IDE ved hjælp af Sbteclipse

Denne blog hjælper dig med at forstå, hvordan du installerer og opsætter sbteclipse-plugin med trinvise instruktioner til kørsel af Scala-applikation i Eclipse IDE.

Beherskede Hadoop? Tid til at komme i gang med Apache Spark

Dette blogindlæg forklarer, hvorfor du skal komme i gang med Apache Spark efter Hadoop & hvorfor læring af Spark efter mestring af hadoop kan gøre underværker for din karriere!

Boring ned på Apache Drill, New Age Query Engine

Denne Apache Drill-tutorial giver dig alle de oplysninger, du har brug for for at komme i gang med Apache Drill-forespørgselsmotor, brug med Hadoop, Big Data & Apache Spark.

Apache Spark combineByKey forklaret

Denne Spark Hadoop-blog fortæller dig alt hvad du behøver at vide om Apache Spark combineByKey. Find den gennemsnitlige score pr. Studerende ved hjælp af combineByKey-metoden.

Apache Falcon: Ny datastyringsplatform til Hadoop-økosystemet

Apache Falcon er en ny datastyringsplatform til Hadoop-økosystemet, der forenkler indbygget foderbehandling og feedadministration på hadoop-klynger. Lær hvordan du konfigurerer det.

Gnistakkumulatorer forklaret: Apache Spark

Denne Apache Spark-blog forklarer Gnistakkumulatorer i detaljer. Lær brugen af gnistakkumulator med eksempler. Gnistakkumulatorer er som Hadoop Mapreduce-tællere.

Apache Flink: Den næste generations Big Data Analytics-ramme til stream- og batch-databehandling

Lær alt om Apache Flink & opsætning af en Flink-klynge i denne blog. Flink understøtter realtids- og batchbehandling og er et must-watch Big Data-teknologi til Big Data Analytics.

Distribueret caching med Broadcast-variabler: Apache Spark

Dette blogindlæg diskuterer distribueret caching med udsendelsesvariabler og får dig i gang med at distribuere store værdier effektivt i Spark-programmering.

CCA- og CCP-certificeringer af Cloudera: Alt hvad du behøver at vide

CCA- og CCP-certificeringer fra Cloudera har erstattet CCDH- og CCSHB-eksamen. Denne blog fortæller dig alt hvad du behøver at vide om de nye certificeringer.

Stateful Transformations with Windowing in Spark Streaming

Dette blogindlæg diskuterer statefulde transformationer med vindue i Spark Streaming. Lær alt om sporing af data på tværs af batches ved hjælp af state-fulde D-Streams.

Kumulativ stateful transformation i Apache Spark Streaming

Dette blogindlæg diskuterer stateful transformationer i Spark Streaming. Lær alt om kumulativ sporing og dygtighed til en Hadoop Spark-karriere.

Big Data In Healthcare: Hvordan Hadoop revolutionerer Healthcare Analytics

Hadoop & Big Data-teknologier revolutionerer sundhedsanalyser. Denne big data i sundhedsbloggen diskuterer, hvordan big data-analyse kan opdrage medicinsk behandling.

Hadoop Streaming: Skrivning af et Hadoop MapReduce-program i Python

Dette blogindlæg på Hadoop Streaming er en trinvis vejledning til at lære at skrive et Hadoop MapReduce-program i Python til at behandle store mængder Big Data.

Big Data Tutorial: Alt hvad du behøver at vide om Big Data!

Denne blog på Big Data Tutorial giver dig et komplet overblik over Big Data, dets egenskaber, applikationer samt udfordringer med Big Data.

HDFS Tutorial: Introduktion til HDFS og dens funktioner

Denne HDFS-selvstudieblog hjælper dig med at forstå HDFS eller Hadoop Distribueret filsystem og dets funktioner. Du vil også kort udforske dets kernekomponenter.

Splunk vs. ELK vs. Sumo Logic: Hvilket fungerer bedst for dig?

I denne Splunk-selvstudie skal du forstå forskellene mellem Splunk vs. ELK vs. Sumo Logic og afgøre, hvilke af disse værktøjer der passer dig bedst.

Splunk Use Case: Dominos succeshistorie

I denne Splunk use case-blog vil du forstå, hvordan Domino's Pizza brugte Splunk til at få indsigt i forbrugeradfærd. Og formulere deres forretningsstrategier.

Installer Hadoop: Opsætning af en enkelt node Hadoop-klynge

Denne vejledning er en trinvis vejledning til installation af Hadoop-klynge og konfiguration på en enkelt node. Alle Hadoop-installationstrin er til CentOS-maskine.