W tej części kursu pokaże jak wygląda widok główny narzędzia TOS Data Integration oraz opowiem o najważniejszych jego elementach pozwalających na szybkie utworzenie procesów przetwarzania danych. Wyjaśnię także podstawowe pojęcia, z którymi spotkasz się w Talendzie (komponent, job, joblet).

Widok główny narzędzia

W wersji 7.2.1 TOS Data Integration zawiera następujące elementy:

a. Pasek menu (ang. menu bar) – zapewnia możliwość modyfikacji podstawowych ustawień projektu oraz umożliwia podstawowe funkcje aplikacji, m.in. odczyt i zapis;
b. Pasek narzędzi (ang. toolbar) – zapewnia szybki dostęp do najczęściej używanych operacji narzędzia;

c. Repozytorium (ang. repository) – centralizuje oraz przechowuje wszystkie niezbędne do zbudowania projektu obiekty;
d. Przestrzeń robocza (ang. design workspace) – umożliwia projektowanie procesów biznesowych przetwarzania danych oraz budowanie procesów integracyjnych;
e. Paleta (ang. palette) – umożliwia dostęp do wszystkich komponentów dostępnych w danej wersji narzędzia Talend;
f. Widok konspektu (ang. outline view) – umożliwia dostęp do parametrów komponentów;
g. Podgląd kodu (ang. code viewer) – dostarcza informacji odnośnie wygenerowanego kodu procesu;
h. Widoki konfiguracji (ang. configuration view) – umożliwiają w prosty i szybki sposób modyfikację ustawień komponentów, ustawień procesu oraz uruchomienie przetwarzania danych.

Elementy widoku konfiguracyjnego, które dobrze znać

Jeśli zaczynasz właśnie swoją przygodę z Talendem, to musisz znać kilka podstawowych widoków konfiguracyjnych, które będziesz używał do zbudowania każdego procesu:

  • widoku procesu (job view) – ogólne informacji o procesie (owner, numer wersji itp.), ustawienia statystyk
  • widok kontekstu (context view) – zmienne przypisane do kontekstu widoczne w procesie integracyjnym
  • widok konfiguracji komponentu (component view) – widok, w którym ustawisz wszystkie parametry komponentów umieszczonych w designerze (np. nazwa pliku źródłowego, połączenie do bazy danych)
  • widok uruchomienia procesu (run view) – w tym widoku uruchomisz proces w trybue debug lub zwykłym oraz podejrzysz zużycie zasobów podczas przetwarzania

Podstawowe pojęcia

Każde narzędzie ETL’owe rządzi się swoimi prawami oraz pojęciami. Jeśli wcześniej używałeś któregokolwiek narzędzia do przetwarzania danych, to pewnie świetnie wiesz o czym mówię. Przyjrzyjmy się więc im bliżej.

Komponent

Komponent można rozpatrywać na dwa sposoby. Z graficznego punktu widzenia jest to tylko ikona, element, który możemy umieścić na ekranie obszaru roboczego. Natomiast z technicznego punktu widzenia jest to element funkcyjny, który wykonuje określone zadanie procesu, np. tAggregateRow odpowiedzialny jest za agregację danych, tTeradataOutput za załadowanie danych do Teradaty

Job

Job jest procesem integracyjnym, przepływem danych od źródła do obiektu docelowego poprzez różne transformacje. Jest on podstawowym obiektem narzędzia TOS DI i skupia się na przełożeniu potrzeb biznesowych na wykonywalny kod. Jak już jesteśmy przy obiektach źródłowych – w Talendzie noszą one nazwę Input, natomiast obiekty docelowe, to Output.

Joblet

Można powiedzieć, że joblet jest specyficznym rodzajem job’a, ale takiego joba, który jest re-używalny. Mogą być one używane w różnych jobach, bądź wielokrotnie w tym samym procesie integracyjnym. Jeżeli potrzebujesz zbudować logikę transformacji, która będzie wykorzystywana w wielu procesach, a zmieniać się będzie tylko obiekt źródłowy bądź docelowy- użyj jobleta zamiast joba. Jest tylko jeden mały mankament – joblety są dostępne tylko w licencjonowanej wersji Talend Data Integration.

Jeśli spodobał Ci się ten kurs to zostaw proszę komentarz poniżej lub udostępnij ten post na swoim Facebook’u, Twitter’ze, LinkedIn lub innej stronie z mediami społecznościowymi.
Dzięki!

Leave a Reply

avatar
  Subscribe  
Powiadom o
Close Menu