Cechy
Opis
InfoShare Academy to wiodąca akademia IT oferująca kompleksowe programy edukacyjne z nowych technologii dla firm. Od 2015 roku wspieramy organizacje w rozwoju zespołów technologicznych poprzez dedykowane kursy Machine Learning, DevOps, Data Engineering, Python, UX/UI Design, AWS i Kubernetes. Nasze szkolenia opierają się na praktycznych umiejętnościach i rzeczywistych przypadkach biznesowych. Współpracujemy z ponad 300 trenerami-praktykami z branży IT, dzięki czemu programy są dostosowane do aktualnych potrzeb rynku. Specjalizujemy się w reskillingu i upskillingu pracowników. Z nami zbudujesz efektywne zespoły wdrażające nowe technologie, które przyspieszą innowacje i wzmocnią konkurencyjność firmy na rynku. Sprawdź naszą ofertę szkoleń dedykowanych dla firm, które zostały stworzone z myślą o rozwijaniu kompetencji Twoich pracowników w obszarze IT.
Azure Databricks jest usługą big data opartą o platformę Apache Spark, która umożliwia tworzenie, uczenie i eksplorację danych w chmurze. Jest to platforma do przetwarzania danych, która zapewnia skalowalność, wydajność i łatwość użytkowania. Azure Databricks umożliwia zespołom łatwiejsze koordynowanie prac i udostępnianie kodu.
- Dla osób, które chcą wykorzystywać dane do optymalizacji procesów.
- Osób, które chcą lepiej poznać Apache Spark.
- Dla osób, które mają podstawową wiedzę z zakresu analizy danych.
- Dla programistów, Data Engineerów i Data Scientist.
- Poznasz fundamenty platformyu Azure Databricks.
- Nauczysz się obróbki i przygotowywania danych
- Dowiesz się jak analizować dane z Databricks SQL
- Nauczysz się korzystać z Apache Spark
What is the Databricks Lakehouse Platform
Describe what the Databricks Lakehouse Platform is
Explain the origin of the Lakehouse data management paradigm
Outline fundamental challenges related to managing and using data
Describe security features of the Databricks Lakehouse Platform
Give examples of organizations that have benefited from using the Databricks Lakehouse Platform
What is Databricks SQL
Summarize fundamental concepts for using Databricks SQL effectively
Identify tools and features in Databricks SQL for querying data and sharing insights
Explain how Databricks SQL supports data analysis workflows that allow users to extract and share business insights
What is Databricks Machine Learning
Describe the basic overview of Databricks Machine Learning
Identify how using Databricks Machine Learning benefits data science and machine learning teams
Summarize the fundamental components and functionalities of Databricks Machine Learning
Exemplify successful use cases of Databricks Machine Learning by real Databricks customers
What is Databricks Data Science and Data Engineering Workspace
Describe the basic overview of Databricks Data Science and Engineering Workspace
Identify assets provided by the workspace
Describe a simple development workflow that queries and aggregates data
Databricks Workspaces and Services
Databricks architecture and services
Data Science and Engineering Workspace
Create and manage interactive clusters
Notebook basics
Git versioning with Databricks Repos
Using Databricks Repos
Getting started with the Databricks Platform
Delta Lakehouse
What is Delta Lake
Managing Delta Tables
Manipulating tables with Delta Lake
Advanced Delta
Relational Entities on Databricks
Databases and Views
Views and CTEs
ETL with Spark SQL
Query files directly
Providing options
Creating Delta Tables
Writing to tables
Cleaning data
Advanced SQL transformations
UDF
Getting Started with Databricks SQL
Getting started with Databricks SQL
Navigating Databricks SQL
Unity Catalog on Databricks SQL
Schemas, tables and views on Databricks SQL
Basic SQL on Databricks SQL
Ingesting data for Databricks SQL
Ingesting data
Joins
Delta commands in Databricks SQL
Presenting Data Visually
Data visualization
Data visualizations on Databricks SQL
Dashboards on Databricks SQL
Notifying stakeholders
Apache Spark Programming – DataFrames
Databricks platform
Databricks ecosystem
Spark SQL
DataFrames
SparkSession
Reader and writer
Data sources
DataFrame and column
Column and expression
Transformations, actions and rows
Apache Spark Programming – Transformations
Aggregation
Aggregation functions
Datetimes
Dates and timestamps
Complex types
Additional functions
UDFs
UDFs vectorized functions
Apache Spark Programming – Spark Internals
Spark architecture
Spark cluster, Spark execution
Shuffling and caching
Query optimization
Partitioning
Apache Spark Programming – Structured Streaming
Apache Spark programming
Streaming concepts
24 h/3 dni
- Certyfikat ukończenia szkolenia
- Miesięczny dostęp do nagrania szkolenia (w przypadku formy online)
- Dostosowanie programu szkolenia do potrzeb klienta