Stor databehandling med Apache Spark & ​​Scala



Apache Spark er kommet op som en stor udvikling inden for databehandling.

generere en tilfældig streng java

IST: 07:00 - 08:00, 17. oktober’14





PDT: 18:30 - 19:30, 16. oktober '14

Begrænsede pladser !! Udfyld formularen til højre og book din plads i dag.



Hej alle sammen, vi afholder et gratis webinar om Apache Spark og Scala den 18. oktober’14. Titlen på webinaret er 'Stor databehandling med Apache Spark og Scala' . I dette webinar diskuteres de væsentlige emner vedrørende Apache Spark og Scala. Eventuelle spørgsmål eller tvivl kan afklares under sessionen.

Emner, der skal dækkes:

  • Hvad er Big Data?
  • Hvad er gnist?
  • Hvorfor gnist?
  • Spark Ecosystem
  • En note om Scala
  • Hvorfor Scala?
  • Hej Spark - Hands on

Hvorfor gnist?

Apache Spark er en open source klyngeregistreringsramme til Hadoop-samfundsklynger. Det kvalificerer sig til at være en af ​​de bedste dataanalyse- og behandlingsmotorer til store data med sin umatchbare hastighed, brugervenlighed og sofistikerede analyser. Følgende er de fordele og funktioner, der gør Apache Spark til et crossover-hit for såvel operationel som efterforskningsanalyse:

  • Programmerne udviklet over Spark kører 100 gange hurtigere end dem, der er udviklet i Hadoop MapReduce.
  • Spark samler 80 operatører på højt niveau.
  • Spark Streaming muliggør databehandling i realtid.
  • GraphX ​​er et bibliotek til grafiske beregninger.
  • MLib er maskinindlæringsbiblioteket til Spark.
  • Primært skrevet i Scala, kan Spark indlejres i ethvert JVM-baseret operativsystem, samtidig kan det også bruges på REPL (læse, evaluere, behandle og indlæse) måde.
  • Det har kraftfuld caching og disk persistens kapaciteter.
  • Spark SQL giver det mulighed for dygtigt at håndtere SQL-forespørgsler
  • Apache Spark kan implementeres gennem Apache Mesos, Garn i HDFS, HBase, Cassandra eller Spark Cluster Manager (Sparks egen klyngemanager).
  • Spark simulerer Scalas funktionelle stil og samlinger API, hvilket er en stor fordel for Scala og Java-udviklere.

Behov for Apache Spark:

Spark giver enorme fordele for industrien med hensyn til hastighed, forskellige opgaver, den kan udføre, fleksibilitet, kvalitetsdataanalyse, omkostningseffektivitet osv., Som er dagens behov. Det leverer avancerede realtids Big Data-analyseløsninger til it-branchen, der imødekommer den stigende kundefterspørgsel. Realtidsanalyse udnytter forretningsmuligheder til dynger. Dens kompatibilitet med Hadoop gør det meget nemt for virksomhederne at hurtigt vedtage det. Der er et stort behov for eksperter og udviklere fra Spark-lærte, da dette er en relativt ny teknologi, der i stigende grad bliver vedtaget.