Cechy

Cechy produktu
Certyfikat:
  • TAK
Język szkolenia:
  • polski
Liczba godzin:
  • 24
Poziom szkolenia:
  • Średniozaawansowany
Producent:
Rodzaj szkolenia:
  • stacjonarnie; online
Szkolenie zamknięte:

Opis

Opis firmy

InfoShare Academy to wiodąca akademia IT oferująca kompleksowe programy edukacyjne z nowych technologii dla firm. Od 2015 roku wspieramy organizacje w rozwoju zespołów technologicznych poprzez dedykowane kursy Machine Learning, DevOps, Data Engineering, Python, UX/UI Design, AWS i Kubernetes. Nasze szkolenia opierają się na praktycznych umiejętnościach i rzeczywistych przypadkach biznesowych. Współpracujemy z ponad 300 trenerami-praktykami z branży IT, dzięki czemu programy są dostosowane do aktualnych potrzeb rynku. Specjalizujemy się w reskillingu i upskillingu pracowników. Z nami zbudujesz efektywne zespoły wdrażające nowe technologie, które przyspieszą innowacje i wzmocnią konkurencyjność firmy na rynku. Sprawdź naszą ofertę szkoleń dedykowanych dla firm, które zostały stworzone z myślą o rozwijaniu kompetencji Twoich pracowników w obszarze IT.

Opis szkolenia

Azure Databricks jest usługą big data opartą o platformę Apache Spark, która umożliwia tworzenie, uczenie i eksplorację danych w chmurze. Jest to platforma do przetwarzania danych, która zapewnia skalowalność, wydajność i łatwość użytkowania. Azure Databricks umożliwia zespołom łatwiejsze koordynowanie prac i udostępnianie kodu.

Dla kogo szkolenie
  • Dla osób, które chcą wykorzystywać dane do optymalizacji procesów.
  • Osób, które chcą lepiej poznać Apache Spark.
  • Dla osób, które mają podstawową wiedzę z zakresu analizy danych.
  • Dla programistów, Data Engineerów i Data Scientist.
Cele

 

Korzyści
  • Poznasz fundamenty platformyu Azure Databricks.
  • Nauczysz się obróbki i przygotowywania danych
  • Dowiesz się jak analizować dane z Databricks SQL
  • Nauczysz się korzystać z Apache Spark
Program szkolenia
  • What is the Databricks Lakehouse Platform

    • Describe what the Databricks Lakehouse Platform is

    • Explain the origin of the Lakehouse data management paradigm

    • Outline fundamental challenges related to managing and using data

    • Describe security features of the Databricks Lakehouse Platform

    • Give examples of organizations that have benefited from using the Databricks Lakehouse Platform

  • What is Databricks SQL

    • Summarize fundamental concepts for using Databricks SQL effectively

    • Identify tools and features in Databricks SQL for querying data and sharing insights

    • Explain how Databricks SQL supports data analysis workflows that allow users to extract and share business insights

  • What is Databricks Machine Learning

    • Describe the basic overview of Databricks Machine Learning

    • Identify how using Databricks Machine Learning benefits data science and machine learning teams

    • Summarize the fundamental components and functionalities of Databricks Machine Learning

    • Exemplify successful use cases of Databricks Machine Learning by real Databricks customers

  • What is Databricks Data Science and Data Engineering Workspace

    • Describe the basic overview of Databricks Data Science and Engineering Workspace

    • Identify assets provided by the workspace

    • Describe a simple development workflow that queries and aggregates data

  • Databricks Workspaces and Services

    • Databricks architecture and services

    • Data Science and Engineering Workspace

    • Create and manage interactive clusters

    • Notebook basics

    • Git versioning with Databricks Repos

    • Using Databricks Repos

    • Getting started with the Databricks Platform

  • Delta Lakehouse

    • What is Delta Lake

    • Managing Delta Tables

    • Manipulating tables with Delta Lake

    • Advanced Delta

  • Relational Entities on Databricks

    • Databases and Views

    • Views and CTEs

  • ETL with Spark SQL

    • Query files directly

    • Providing options

    • Creating Delta Tables

    • Writing to tables

    • Cleaning data

    • Advanced SQL transformations

    • UDF

  • Getting Started with Databricks SQL

    • Getting started with Databricks SQL

    • Navigating Databricks SQL

    • Unity Catalog on Databricks SQL

    • Schemas, tables and views on Databricks SQL

  • Basic SQL on Databricks SQL

    • Ingesting data for Databricks SQL

    • Ingesting data

    • Joins

    • Delta commands in Databricks SQL

  • Presenting Data Visually

    • Data visualization

    • Data visualizations on Databricks SQL

    • Dashboards on Databricks SQL

    • Notifying stakeholders

  • Apache Spark Programming – DataFrames

    • Databricks platform

    • Databricks ecosystem

    • Spark SQL

    • DataFrames

    • SparkSession

    • Reader and writer

    • Data sources

    • DataFrame and column

    • Column and expression

    • Transformations, actions and rows

  • Apache Spark Programming – Transformations

    • Aggregation

    • Aggregation functions

    • Datetimes

    • Dates and timestamps

    • Complex types

    • Additional functions

    • UDFs

    • UDFs vectorized functions

  • Apache Spark Programming – Spark Internals

    • Spark architecture

    • Spark cluster, Spark execution

    • Shuffling and caching

    • Query optimization

    • Partitioning

  • Apache Spark Programming – Structured Streaming

    • Apache Spark programming

    • Streaming concepts

Czas trwania

24 h/3 dni

Cena zawiera
  • Certyfikat ukończenia szkolenia
  • Miesięczny dostęp do nagrania szkolenia (w przypadku formy online)
  • Dostosowanie programu szkolenia do potrzeb klienta

Zamów szkolenie