Big Data with Hadoop/Spark (English)

Big Data with Hadoop/Spark (English)

Deze cursus hebben we niet meer in ons assortiment maar nog wel andere cursussen, bijvoorbeeld:

Er zijn geen gerelateerde cursussen.

Manipulating big data over a distributed cluster for processing and analysis is rampant in industry and one of the most sought after skills. This course is an a 3 day intensive introduction to big data with Apache Hadoop and Spark. Participants gain an understanding of what insights big data can deliver through hands-on experience with tools and systems used by big data and machine learning engineers. At the end of the course, participants will be able to build a complete end
to end data pipeline starting from data ingestion and storage to data processing and analysis. Topics covered include HDFS, Hive, Impala, Sqoop, MapReduce, HBase, Spark and SparkML. All hands on exercises are conducted on in Python and Shell, therefore some prior experience is advised. Participants will have an opportunity to
run code on a real Hadoop/Spark cluster.

Doel

  • This course gives an introduction to big data technologies using the Cloudera stack (Cloud/On-Prem). The use of the Cloudera stack (Cloud/On-Prem) is chosen because of the ease of usage and development it provides. Since infrastructure is already arranged for in this way, students can focus on concepts and applying them in lab exercises.

Doelgroep

The intended audience is beginning professionals in Big Data and Business Analytics.

Voorkennis

Introductie in Python – Mogelijkheden en Code Begrijpen of vergelijkbare kennis.
Prior experience in programming is not needed but Python basics are recommended. Instructions and code samples will be arranged by the instructor.

Bijzonderheden

  • Het cursusmateriaal van deze cursus is veelal digitaal. Om optimaal gebruik te kunnen maken van het cursusmateriaal adviseren we je om een eigen device (laptop, tablet) mee te nemen. Dit is echter alleen een advies, geen noodzaak.

Onderwerpen

  • Day 1: Big Data Fundamentals
    • Understanding Big Data:
    • Applications: Examples from Retail / Financial Services / Healthcare / Manufacturing
    • Overview of (Big) Data Technologies (storage models)
    • Introduction to Hadoop
    • HDFS
    • HDFS Schema Design
    • Lab: Working with HDFS: Technical Commands
    • AWS S3 (Object store)
    • Lab interacting with S3 on AWS
  • Day 2: Big Data Fundamentals
    • Map Reduce (Quick Conceptual Overview)
    • Hive (Detailed Overview)
    • Lab: Load Data on HDFS. Create Tables on HDFS. Querying SQL (Joins etc)
    • Pig (Quick Mention/Overview)
    • Impala (Detailed Overview)
    • Lab: Load Data on HDFS. Create Tables on Impala. Querying SQL (Joins etc)
    • Hbase (Detailed overview)
    • Lab: Setting up an Hbase Table, loading data, retrieving data
    • Summary
  • Day 3: Big Data Fundamentals
    • Spark
    • Lab: PySpark exercise using DataFrames and SparkSQL
    • SparkML
    • Lab: Moving Data into and out of HDFS
    • Real Life Case Application Architecture (End to End Pipeline)
    • Wrap Up

Planning & Prijs

Gerelateerde cursussen

Er zijn geen gerelateerde cursussen.

Ervaringen

ervaringen verzameld via Logo Springtest

Lucienne Groenendaal

Secretarieel medewerkster

"Training was prima, goede tips gekregen met af en toe een grap en grol. Locatie was prima, goed verzogd vwb koffie/thee, fruit en koekje. Mensen ook zeer vriendelijk. Lunch was perfect en zeer uitgebreid."

9

Ariana Scheepers

"De cursus was goed, en de verzorging ook!Ik heb er veel van opgestoken! De lokatie in Nieuwegein is goed te bereiken met het openbaar vervoer, dus dat is prettig. Tot een volgenden keer."

10

Eric Pos

Procesbeheerder bij Gemeente Amersfoort

"Ik vond de training erg leerzaam. De inhoud was van een hoog niveau en de docent was goed thuis in de materie. Ik stel het vooral op prijs dat er diep op de concepten werd ingegaan."

9
De cursus is toegevoegd aan jouw favorieten.

Jouw favorieten kun je bekijken via je profiel (deze vind je in het menu bovenaan de website).

Kunnen wij je helpen?

Laat jouw telefoonnummer of e-mailadres achter en wij nemen binnen 24 uur contact met je op.


Cursus: Big Data with Hadoop/Spark (English)


    E-mailadres

    Telefoonnummer

    Opmerking of vraag

    Meer weten

    Vul onderstaand formulier in en je ontvangt meer informatie over deze cursus.


    Cursus: Big Data with Hadoop/Spark (English)

      Wij helpen je graag

      Geen tijd om ons gehele aanbod aan cursussen te bekijken? Of heb je een andere vraag? Wij helpen je graag. Vul onderstaande vragen in en we nemen binnen 24 uur contact met je op.

      Big Data with Hadoop/Spark (English)






        Onderwerpen
        Actieve filters: Wis alle filters
        Pageloader
        PRIVACY VOORWAARDEN

        Jouw persoonsgegevens worden opgenomen in onze beschermde database en worden niet aan derden verstrekt. Je stemt hiermee in dat wij jou van onze aanbiedingen op de hoogte houden. In al onze correspondentie zit een afmeldmogelijkheid