Moduł 1 – Wprowadzenie do Google Cloud Platform
Google BigQuery jako część platformy Google Cloud Platform (GCP)
Komplementarne usługi GCP wykorzystywane razem z BigQuery (Google Cloud Storage, Cloud SQL, Cloud Functions, DataPrep i inne)
Omówienie podstawowych komponentów GCP potrzebnych w pracy z BigQuery (projekt, konto rozliczeniowe, uprawnienia użytkowników)
Wprowadzenie do hurtowni danych – idea działania, najważniejsze pojęcia i założenia
Moduł 2 – Podstawy pracy z Google BigQuery
Zbiory danych, tabele i zapytania – jak wygląda praca z danymi w BigQuery
Edytor zapytań w interfejsie Google BigQuery
Cloud Shell – praca z danymi w środowisku CLI (command line)
Pobieranie danych z wykorzystaniem podstawowych zapytań SELECT
Manipulowanie wynikami zapytań z wykorzystaniem filtrowania (WHERE), sortowania (ORDER BY)
Agregowanie danych (COUNT, SUM) z wykorzystaniem GROUP BY i HAVING
Moduł 3 – Tworzenie i zarządzanie zbiorami danych i tabelami
Tworzenie i ustawienia zbiorów danych
Tworzenie tabeli w oparciu o schemat i zapytania CREATE OR REPLACE TABLE
Podstawowe typy danych i tryby kolumn
Praca z tablicami (arrays) i strukturami (structs) w BigQuery
Partycjonowanie danych i zapytania do wielu tabel z wykorzystaniem sufiksów (wildcard tables)
Moduł 4 – Ładowanie danych do Google BigQuery
Wprowadzenie do procesów ETL i ELT na przykładzie hurtowni danych BigQuery
Publiczne zbiory danych (BigQuery Public Datasets)
Import danych z Google Cloud Storage do BigQuery
Wczytywanie danych z zewnętrznych źródeł danych – MySQL, PostgreSQL
Wczytywanie danych z Google Drive i Google Sheets
Logowanie danych w BigQuery za pomocą BigQuery API
Automatyzacja ładowania danych za pomocą Data Transfer Service i Scheduled Queries
Moduł 5 – Pisanie zapytań SQL w BigQuery – ćwiczenia praktyczne
Łączenie danych z wielu tabel z wykorzystaniem JOINs
Common Table Expressions z wykorzystaniem WITH w BigQuery
Praca z tablicami danych z wykorzystaniem funkcji ARRAY_AGG i UNNEST
Formatowanie daty i czasu – praca z danymi TIMESTAMP, DATETIME i DATE
Saved Queries – zapisywanie zapytań i współpraca w zespole
Moduł 6 – Wizualizacja danych i raportowanie z wykorzystaniem BigQuery
Eksport i analiza danych z BigQuery w Google Sheets
Tworzenie dashboardów w Looker Studio w oparciu o dane z Google BigQuery
Integracja BigQuery z innymi narzędziami do wizualizacji danych (PowerBI, Tableau)
Moduł 7 – Praktyczne zastosowania BigQuery w codziennej pracy
BigQuery API i biblioteki Google Cloud Client Libraries w popularnych językach programowania
Łączenie Google BigQuery z popularnymi narzędziami Data Science (Python, pandas, Jupyter)
Tworzenie konta serwisowego (service account) i korzystanie z danych w BigQuery w zewnętrznych programach na przykładzie DataGrip
Wprowadzenie i omówienie funkcjonalności uczenia maszynowego BigQuery ML – przykłady zastosowań w regresji liniowej i prognozie szeregów czasowych
Cechy
Opis
InfoShare Academy to wiodąca akademia IT oferująca kompleksowe programy edukacyjne z nowych technologii dla firm. Od 2015 roku wspieramy organizacje w rozwoju zespołów technologicznych poprzez dedykowane kursy Machine Learning, DevOps, Data Engineering, Python, UX/UI Design, AWS i Kubernetes. Nasze szkolenia opierają się na praktycznych umiejętnościach i rzeczywistych przypadkach biznesowych. Współpracujemy z ponad 300 trenerami-praktykami z branży IT, dzięki czemu programy są dostosowane do aktualnych potrzeb rynku. Specjalizujemy się w reskillingu i upskillingu pracowników. Z nami zbudujesz efektywne zespoły wdrażające nowe technologie, które przyspieszą innowacje i wzmocnią konkurencyjność firmy na rynku. Sprawdź naszą ofertę szkoleń dedykowanych dla firm, które zostały stworzone z myślą o rozwijaniu kompetencji Twoich pracowników w obszarze IT.
Google BigQuery jest hurtownią danych dostępną w usłudze Google Cloud. Zapewnia przechowywanie i zarządzanie dużą ilością danych. BigQuery cechuje duża skalowalność i to, że zarządzanie nie wymaga utrzymywania drogiej infrastruktury.
- Dla architektów rozwiązań i specjalistów w zakresie hurtowni danych
- Dla analityków danych i osób zajmujących się przetwarzaniem danych
- Dla inżynierów danych odpowiedzialnych za tworzenie i utrzymanie infrastruktury
- Dla osób, które znają podstawy języka SQL
- opanowanie od podstaw działania Google BigQuery – dynamicznie rozwijającej się hurtowni danych, będącej elementem chmury Google (Google Cloud Platform)
- nauczenie się podstaw pracy w BigQuery – pisania zapytań, tworzenia i zarządzania zbiorami danych oraz tabelami, tworzenia i projektowania procesów ETL i ELT z wykorzystaniem narzędzi dostępnych w chmurze Google
- dowiesz się, jak wizualizować dane zbierane w hurtowni danych w Looker Studio i Google Sheets, a także jak połączyć BigQuery z popularnymi narzędziami takimi jak PowerBI i Tableau
- poznasz praktyczne zastosowania BigQuery w data science oraz dowiesz się, jak łatwo rozpocząć uczenie maszynowe dzięki funkcjom BigQuery ML.
16 h/2 dni
- Certyfikat ukończenia szkolenia
- Miesięczny dostęp do nagrania szkolenia (w przypadku formy online)
- Dostosowanie programu szkolenia do potrzeb klienta