To jakie komponenty są dla Ciebie najważniejsze z pewnością zależy od celów nauki niniejszego narzędzia oraz procesów jakie w przyszłości będziesz w nim budował. Dla jednych bardzo ważne będą komponenty dotyczące konkretnej technologii np. Teradaty, lecz dla innych będą one zupełnie zbędne. Jest jednak grupa komponentów, jakich znajomość przyda Ci się niezależnie od technologii jakimi się zajmujesz i celów nauki. Właśnie w tej części kursu, pokaże Ci najpopularniejsze komponenty TOS DI.

tMap

tMap to zdecydowanie jeden z najczęściej używanych, jak i nadużywanych komponentów. Służy on do transformacji, łączeniu danych z wielu źródeł, jak i transportowania ich do jednego jak i wielu obiektów docelowych. W tMapie możesz wykorzystywać zmienne, masz prosty i szybki dostęp do funkcji transformujących oraz z łatwością przefiltrujesz nim dane wysyłane do docelowych obiektów.

tLogRow

tLogRow wyświetla wyniki procesu bądź dane ładowania w widoku Run. Możemy go spokojnie wykorzystać podczas testowania logiki procesu sprawdzając na żywo wyniki w konsoli.

tRunJob

Jeśli budujesz wiele procesów integracyjnych, z pewnością będziesz chciał uruchamiać je z określoną kolejnością. I tu właśnie pojawia się tRunJob – pozwala on na zarządzanie sekwencją job’ów.

tFilterRow

Jak sama nazwa mówi, tFilterRow filtruje dane wejściowe pozwalając przy tym na zastosowanie wielu warunków. Umożliwia nam wyeliminowanie z dalszego przetwarzania niepotrzebnych danych, ze względów technicznych bądź biznesowych.

tAggregateRow

tAggregateRow odpowiada za agregację danych na podstawie wskazanych parametrów komponentu. Agregacja jest możliwa na podstawie wielu kolumn. Z dostępnych operacji mamy: count, min, max, avg, sum, first, last, list, count(distinct), union(geometry) oraz standard deviation.

tPreJob & tPostJob

Budując skomplikowane procesy integracyjne nie obędziesz się bez tPreJob oraz tPostJob. Pierwszy z nich rozpoczyna wykonywanie procesu roboczego i wyzwala zadanie do wykonania, które zostanie uruchomione przed rozpoczęciem głównego przepływu danych. Z kolei tPostJob wyzwala zadanie lub proces, który ma zostać uruchomiony po wykonaniu zadania głównego.

tSortRow

tSortRow sortuje dane wejściowe na podstawie jednej bądź wielu kolumn wejściowych według zdefiniowanej kolejności i rodzaju sortowania. 

tFileList

Komponent tFileList interuje zestaw plików bądź katalogów w danym folderze na podstawie zdefiniowanej maski. Możliwe jest zdefiniowanie kolejności iteracji  – w zależności od daty modyfikacji, nazwy pliku bądź jego rozmiaru, w kolejności malejącej bądź rosnącej. 

tJava

Mimo iż Talend DI posiada obecnie ponad 900 gotowych do użycia komponentów, często zdarza się, że logika przetwarzania wymaga od nas napisania trochę własnego, bardziej dopasowanego do naszych potrzeb kodu. A ponieważ TOS DI napisany został w Javie, z pomocą przychodzi nam komponent tJava. 

tSendMail

Komponent tSendMail jest odpowiedzialny za wysyłanie wiadomości e-mail z możliwością dodania załączników. Z pewnością pomoże w przesyłaniu notyfikacji o zakończeniu proces bądź błędach powstałych podczas jego wykonania.

Objaśnienia komponentów

To zaledwie 10 z ponad 900 komponentów stworzonych dla narzędzia Talend Data Integration, lecz nie zważając na komponenty powiązane z obiektami źródłowymi czy docelowymi, zdecydowanie najczęściej pojawiają się w procesach ETL.

Jeśli jednak potrzebujesz wsparcia dla innych komponentów Talend, a Internet zawiedzie, możesz posłużyć się krótkim opisem i przykładowym użyciem komponentów udostępnionym przez Talenda. W tym celu, przeciągnij wybrany komponent na ekran designera, a następnie wciśnij przycisk F1. Pojawi się nowa zakładka Help.

Wybierając tReplace odpowiadający nazwie komponentu, który wybrałeś, ukaże się jego opis:

Jeśli spodobał Ci się ten kurs to zostaw proszę komentarz poniżej lub udostępnij ten post na swoim Facebook’u, Twitter’ze, LinkedIn lub innej stronie z mediami społecznościowymi.
Dzięki!

Leave a Reply

avatar
  Subscribe  
Powiadom o
Close Menu