Big Data in AWS führt Sie in cloudbasierte Big Data-Lösungen wie Amazon EMR, Amazon Redshift und Kinesis ein.
In diesem Seminar erhalten Sie Informationen für die Arbeit mit Amazon EMR, Amazon Redshift, Amazon Kinesis, Amazon Athena und allen weiteren Komponenten der Big Data-Plattform von AWS für die Verarbeitung von Daten und die Erstellung von Big Data-Umgebungen.
Nutzen
Dieser Kurs bietet eine Einführung in Cloud-basierte Big Data-Lösungen und Amazon Elastic MapReduce (EMR), die AWS-Plattform für Big Data. In diesem Kurs zeigen wir Ihnen, wie Sie Amazon EMR zum Verarbeiten von Daten mithilfe des umfassenden Angebots an Hadoop-Tools wie beispielsweise Pig und Hive einsetzen. Sie erfahren außerdem, wie Sie Big Data-Umgebungen erstellen, mit Amazon DynamoDB, Amazon Redshift und Amazon Kinesis arbeiten, und wie Sie durch Befolgen bewährter Methoden sichere und wirtschaftliche Big Data-Umgebungen einrichten.In diesem Kurs lernen Sie Folgendes:
Verstehen von Apache Hadoop im Kontext von Amazon EMR
Verstehen der Architektur eines Amazon EMR-Clusters
Starten eines Amazon EMR-Clusters mithilfe eines geeigneten Amazon-Computerabbilds (AMI) und Amazon EC2-Instance-Typs
Auswählen passender AWS-Datenspeicheroptionen für Amazon EMR
Verstehen der Optionen für die Eingabe, Übertragung und Komprimierung von Daten zur Nutzung mit Amazon EMR
Einsetzen gängiger Programmierungs-Frameworks, die für Amazon EMR zur Verfügung stehen, wie z. B. Hive, Pig und Streaming
Implementieren einer Big Data-Lösung mithilfe von Amazon Redshift
Nutzen von Software zur Visualisierung von Big Data
Auswählen geeigneter Sicherheitsoptionen für Amazon EMR und Ihre Daten
Ausführen von In-Memory-Datenanalysen mithilfe von Spark und Shark in Amazon EMR
Auswählen passender Optionen zur wirtschaftlichen Verwaltung Ihrer Amazon EMR-Umgebung
Verstehen der Vorteile der Nutzung von Amazon Kinesis für Big Data
Zielgruppe
Zuständige für die Konzeption und Umsetzung von Big Data-Lösungen, d. h. Solutions Architects und SysOps-Administratoren
Big Data-Manager und Big Data-Analysten, die sich für Big Data-Lösungen in AWS interessieren
Anforderungen
Grundkenntnisse in Big Data-Technologien einschließlich Apache Hadoop und HDFS
Kenntnisse in Big Data-Technologien wie Pig, Hive und MapReduce sind hilfreich, aber nicht erforderlich
Arbeitskenntnisse der wichtigen AWS-Services und Implementierung öffentlicher Clouds
Teilnehmer müssen den Kurs AWS Technical Essentials (AWSE) absolviert haben oder eine ähnliche Erfahrung aufweisen
Grundlegendes Verständnis von Data Warehouses, relationalen Datenbanksystemen und Datenbank-Design
Inhalte
In diesem Kurs werden die folgenden Konzepte behandelt:1. Tag
Übersicht zu Big Data, Apache Hadoop und den Vorteilen von Amazon EMR
Architektur von Amazon EMR
Verwenden von Amazon EMR
Starten und Nutzen eines Amazon EMR-Clusters
Hadoop-Programmierungs-Frameworks 2. Tag
Verwenden von Hive für die Analyse von Werbung
Verwenden von Streaming für biowissenschaftliche Analysen
Übersicht: Spark und Shark für In-Memory-Analysen
Verwenden von Spark und Shark für In-Memory-Analysen
Kostenmanagement für Amazon EMR
Übersicht über die Amazon EMR-Sicherheit
Eingabe, Übertragung und Komprimierung von Daten
Verwenden von Amazon Kinesis für die Verarbeitung von Big Data in Echtzeit3. Tag
Verwenden von Amazon Kinesis und Amazon EMR für Streaming und Verarbeitung von Big Data
Optionen für die Datenspeicherung in AWS
Verwenden von DynamoDB mit Amazon EMR
Übersicht: Amazon Redshift und Big Data
Verwenden von Amazon Redshift für Big Data
Visualisieren und Orchestrieren von Big Data
Visualisieren von Big Data mit Tableau Desktop oder Jaspersoft BI