W szkoleniu nauczyliśmy się budować proste procesy integracyjne, procesy master i standalone, poznaliśmy zmienne kontekstowe oraz dowiedzieliśmy się jak używać obiekty w repozytorium. Czas wspomnieć o najlepszych praktykach budowania przepływów danych w Talend Data Integration, które ułatwią pracę tak Tobie, jak i innym podczas analizy już przygotowanych procesów ETL.

Od lewej do prawej

Zgodnie z najlepszymi praktykami Talend, wszystkie przepływy danych w ramach procesu powinny być zbudowane od lewej do prawej i z góry na dół.

Nazwij swoje komponenty

Komponent z nazwą tDBInput_1 jest na prawdę w porządku, ale dla początkującego dewelopera, który zbudował swój pierwszy proces szybko i jeszcze nie ma nawet pojęcia, gdzie mógłby zmienić ta nazwę. Aby uczynić proces bardziej czytelnym i łatwiejszym w analizie dla innych, nazwij sobie komponenty w sposób opisujący ich zadanie, ale też zwięzły.

Używaj zmiennych kontekstowych

Jeśli Twój proces jest zależny od danych z zewnątrz, zawsze przechowuj je jako zmienne kontekstowe. Ścieżki do plików, czy ich nazwy także przechowuj jako zmienne zamiast zostawiać je wpisane “na sztywno”. Pamiętaj, żeby uczynić swoje procesy elastycznymi i łatwymi w modyfikacji w przypadku zmian.

Utrzymuj porządek w repozytorium

Jeśli używasz Talend DI jedynie na swój użytek, prawdopodobnie nie odczujesz dużego nieporządku w repozytorium. Wyobraź sobie jednak jak mogłoby ono wyglądać, gdybyś pracował przy kilku projektach, a wszystkie procesy byłyby wrzucone pod zakładką Job Designs – odszukanie konkretnego procesu na pewno nie należałoby do najszybszych i najprostszych zadań. Pamiętaj więc, aby procesy umieszczać w dedykowanych folderach projektowych. Dodatkowo możesz zapewnić sobie większy porządek nadając procesom odpowiednie nazwy, np. 100 – procesy ładujące warstwę danych przejściowych, 200 – CDC, 600 – procesy testowe, a procesy master jako 900.

Nie zapomnij o dokumentacji

Ostatnią dobrą praktyką jaką chciałabym się z Tobą podzielić jest dokumentacja. Pamiętaj, aby po utworzeniu procesu przepływu danych zrobić krótką adnotację używając komponentu tNote z podstawowymi informacjami, np. autorem czy datą utworzenia procesu. Możesz także dodawać informację o poszczególnych komponentach poprzez zapisku w zakładce Component -> Documentation.

Podczas tworzenia każdego joba wymagana jest jedynie jego nazwa – pamiętaj jednak, że podanie celu jego utworzenia i opisu ułatwi innym jego późniejszą analizę.

Jeśli spodobał Ci się ten post to zostaw proszę komentarz poniżej oraz udostępnij ten post na swoim Facebook’u, Twitter’ze, LinkedIn lub innej stronie z mediami społecznościowymi.
Dzięki!

0 0 vote
Article Rating
Subscribe
Powiadom o
guest
0 komentarzy
Inline Feedbacks
View all comments