Cechy

Cechy produktu
Certyfikat:
  • TAK
Język szkolenia:
  • polski
Liczba godzin:
  • 32
Poziom szkolenia:
  • Średniozaawansowany
Producent:
Rodzaj szkolenia:
  • stacjonarnie; online
Szkolenie zamknięte:

Opis

Opis firmy

InfoShare Academy to wiodąca akademia IT oferująca kompleksowe programy edukacyjne z nowych technologii dla firm. Od 2015 roku wspieramy organizacje w rozwoju zespołów technologicznych poprzez dedykowane kursy Machine Learning, DevOps, Data Engineering, Python, UX/UI Design, AWS i Kubernetes. Nasze szkolenia opierają się na praktycznych umiejętnościach i rzeczywistych przypadkach biznesowych. Współpracujemy z ponad 300 trenerami-praktykami z branży IT, dzięki czemu programy są dostosowane do aktualnych potrzeb rynku. Specjalizujemy się w reskillingu i upskillingu pracowników. Z nami zbudujesz efektywne zespoły wdrażające nowe technologie, które przyspieszą innowacje i wzmocnią konkurencyjność firmy na rynku. Sprawdź naszą ofertę szkoleń dedykowanych dla firm, które zostały stworzone z myślą o rozwijaniu kompetencji Twoich pracowników w obszarze IT.

Opis szkolenia

PySpark to biblioteka dla Apache Spark, która umożliwia tworzenie i uruchamianie zadań rozproszonych na klastrach w języku Python. PySpark zapewnia interfejs API do pracy z danymi rozproszonymi przez Spark, a także dostęp do wszystkich funkcji Spark, takich jak mapowanie, agregacja, filtrowanie i grupowanie danych. PySpark jest licznie wykorzystywany w Big Data, analizie danych i uczeniu maszynowym.

Dla kogo szkolenie
  • Dla programistów ze znajomością języka Python
  • Dla osób, które chcą poznać jedno z najpopularniejszych narzędzi do przetwarzania danych.
  • Dla analityków ze znajomością języka Python.
  • Dla specjalistów Data Scientist
Cele

 

Korzyści
  • Dowiesz się jakie jest zastosowanie Big Data w organizacji
  • Poznasz podstawowe zagadnienie związane z pracą na danych w Apache Spark
  • Nauczysz się Spark Project Core i Spark SQL
  • Dowiesz się jak wykorzystać Spark M w praktycznych zastosowaniach
Program szkolenia
  • Moduł 1 – Architektura Apache Spark

    • Co jest czym w organizacji

    • Miejsce w rzeczywistości „Big Data”

  • Moduł 2 – RDDs

    • Podstawowe zagadnienia związane z pracą na danych w Apache Spark

  • Moduł 3 – Różnice między składnią Pythona a PySparka

    • RDD a Pandas DataFrame

  • Moduł 4 – Zmienne, partycjonowanie oraz inne zagadnienia Spark Project Core

  • Moduł 5 – Spark SQL

    • Praca na DataFrame

    • Składnia

    • Schematy

    • Agregacje

  • Moduł 6 – Spark ML

  • Moduł 7 – Prototypowanie

  • Moduł 8 – Uruchamianie i zarządzanie zadaniami w klastrze

  • Moduł 9 – Testowanie procesów

  • Moduł 10 – Optymalizacja i konfiguracja zadań

  • Moduł 11 – Spark Structured Streaming

  • Moduł 12 – Sesja Q&A

Czas trwania

32 h/ 4dni

Cena zawiera
  • Certyfikat ukończenia szkolenia
  • Miesięczny dostęp do nagrania szkolenia (w przypadku formy online)
  • Dostosowanie programu szkolenia do potrzeb klienta

Zamów szkolenie