Witaj! W poprzednim tutorialu stworzyliśmy wirtualną maszynę Hortonworks Sandbox na platformie Azure (Hortonworks Sandbox Data Platfrom w chmurze). W tym samouczku pokażę, jak połączyć się z tą maszyną i jak korzystać ze platformy Hortonworks.
Jak utworzyć środowisko Hortonworks Sandbox Data Platfrom w chmurze Microsoft Azure?
1. Dodaj brakujące porty przychodzące

Przede wszystkim musimy dodać do VM dodatkowe reguły portów wejściowych. Pozwoli nam to na przykład połączyć się z Ambari lub Zeppelinem. Otwórz wcześniej utworzoną maszynę wirtualną i kliknij kartę „Networking”. Po prawej stronie znajdziesz „Add inbound port rule”.
Na tą chwilę stoworzymy dwie dodatkowe reguły:
- Port 8080 – dla Ambari
- Port 8888 – dla Hortonworks Dashboard




W powiadomieniach zobaczysz ukończone zadanie, jak na poniższym zrzucie ekranu. Teraz w zakładce „Networking” zobaczysz, że Twoje nowe reguły przychodzące są również widoczne na liście.
2. Dostęp do Hortonworks Dashboard i Ambari
W przegladarce otwórz kolejno liki. Wzór jest prosty: http://<host_ip_address>:<port>
- http://40.115.47.144:8888/ – Hortonworks Dashboard
- http://40.115.47.144:8080/ – Ambari


Aby zalogować się do Ambari użyj: maria_dev jako użytkownika i hasło. Następnie zobaczysz wiele projektów Apache wymienionych w lewym menu w Ambrai takich jak: HDFS, YARN, MapReduce2, Tez, Hive i tak dalej … W tej chwili nie wyjaśnię, jaka jest rola każdego z nich i jak każdy działa, ponieważ możesz się przestraszyć oraz zniechęcić na początku swojej przygody w świecie Big Data. Omówię i wyjaśnię każdy z nich w następnych artykułach wraz z czytelnym przykładem, który pomoże ci zrozumieć, jak to wszystko działa :).
W tej chwili najważniejsze jest, aby świeciło się zielone światło przed nimi.

3. Jak połączyć się do Hortonworks’a za pomocą SSH?
Możesz także połączyć się z wirtualną maszyną Hortonworks przez SSH. Z Windows możesz na przykład użyć oprogramowania Putty. Jeśli używasz Linuksa (np. Ubuntu), możesz po prostu użyć konsoli Terminal.
Ustaw połączenie do Twojej maszyny wirtualnej używając wzoru:<użytkownik>@<adres_ip_maszyny> (zapisz sobię to połączenie, na pewno przyda Ci się w przyszłości).

Nazwa użytkownika i hasło są takie same jak w momencie tworzenia tej maszyny wirtualnej w poprzednim samouczku.
Zmień użytkownika na root. Zostaniesz poproszony o podanie hasła (w tym przypadku wpisz hasło dla swojego użytkownika, tutaj dla użytkownika pawel).
[pawel@sandbox-host ~]$ sudo su
Następnie podłącz się do sandbox-hdp.hortonworks.com, która jest widoczna pod adresem IP: 172.17.0.2.
[root@sandbox-host pawel]# ssh 172.17.0.2

Wpisz: yes, aby kontynuować próbę połączenia. Po tym zostaniesz poinformowany, że musisz zmienić hasło dla użytkownika root. Aktualne hasło dla użytkownika root to po prostu: hadoop.
The authenticity of host '172.17.0.2 (172.17.0.2)' can't be established. RSA key fingerprint is SHA256:oCHVVt8XBDItJbjH0XExlhePO93VcXJQGHx5WdiMhLE. RSA key fingerprint is MD5:41:23:bd:19:8f:59:16:da:40:4c:42:7f:52:6f:e5:f3. Are you sure you want to continue connecting (yes/no)? yes Warning: Permanently added '172.17.0.2' (RSA) to the list of known hosts. root@172.17.0.2's password: You are required to change your password immediately (root enforced) Changing password for root. (current) UNIX password: New password: Retype new password:
Kiedy zalogowaliśmy się do piaskownicy, możemy sprawdzić, czy na przykład możemy wyświetlić pliki w folderze głównym na HDFS’ie.
Wyświetl pliki w katalogu głównym na HDFS:
[root@sandbox-hdp ~]# hdfs dfs -ls /

3. Podsumowanie
Po zakończeniu tego samouczka powinieneś być w stanie połączyć się ze środowiskiem Hortonworks Sandbox.