Paano Magsanay ng Hadoop Online: 11 Mga Hakbang (na may Mga Larawan)

Talaan ng mga Nilalaman:

Paano Magsanay ng Hadoop Online: 11 Mga Hakbang (na may Mga Larawan)
Paano Magsanay ng Hadoop Online: 11 Mga Hakbang (na may Mga Larawan)

Video: Paano Magsanay ng Hadoop Online: 11 Mga Hakbang (na may Mga Larawan)

Video: Paano Magsanay ng Hadoop Online: 11 Mga Hakbang (na may Mga Larawan)
Video: Paano Mababasa Ang Isip Ng Isang Tao? (14 PSYCHOLOGICAL TIPS) 2024, Abril
Anonim

Bilang isa sa pinakamakapangyarihang mga framework ng open-source na programa, ang Hadoop ay isang mahalagang tool para sa sinumang umaasa na makahanap ng isang malaking trabaho sa data. Kung nais mong magsipilyo sa iyong mga kasanayan sa Hadoop o malaman kung paano ito makabisado, ang iyong pinakamahusay na pagpipilian ay kumuha ng isang kurso sa online. Kung hindi ito magagamit sa iyo, manuod ng mga libreng online na tutorial at gumamit ng mga sanggunian na materyales upang i-troubleshoot ang mga tukoy na problema. Kapag natapos mo na ang mga pangunahing kaalaman, magsanay sa maliliit na hanay ng data sa totoong mundo upang mapabuti ang iyong mga kasanayan.

Mga hakbang

Paraan 1 ng 2: Pagkuha ng Mga Kurso at Paggamit ng Mga Tutorial

Pagsasanay Hadoop Online Hakbang 1
Pagsasanay Hadoop Online Hakbang 1

Hakbang 1. Mag-sign up para sa Cloudera para sa isang 6-bahagi na kurso at mga interactive na tutorial

Binibigyan ka ni Cloudera ng mga halimbawa ng tunay na mundo upang magsanay sa isang read-only na kapaligiran, kaya't hindi ka dapat magalala tungkol sa paggawa ng malalaking pagkakamali. Nag-aalok din sila ng mga tool na analytic upang matulungan kang mag-eksperimento sa data ng pag-query, pati na rin isang libreng live na demo na tinatawag na Cloudera Live upang matulungan kang malaman ang kapaligiran ng Hadoop.

Bagaman ang kumpleto, malalim na kurso na may sertipikasyon ay nagkakahalaga sa iyo ng $ 295, tiyak na sulit ito kung ginagamit mo ang mga kasanayang ito para sa iyong trabaho. Ang paggamit ng kurso na Cloudera ay makakatulong sa iyong mahuli ang mga pagkakamali at makatipid ng oras, na mabilis na magbabayad para sa sarili nito

Pagsasanay Hadoop Online Hakbang 2
Pagsasanay Hadoop Online Hakbang 2

Hakbang 2. Subukan ang mga libreng online na kurso sa pamamagitan ng Cloudera kung alam mo na ang mga pangunahing kaalaman

Kung mayroon kang karanasan sa Hadoop at nais mo lamang ng isang pag-refresh, maaaring hindi mo kailangang ibalita ang pera para sa 6-bahagi na kurso. Sa halip, suriin ang mga libreng kurso sa online sa website ng Cloudera University.

Mayroong mga mapagkukunan para sa mga tagapangasiwa, developer, at analista ng data, kaya't hindi mahalaga kung ano ang iyong tungkulin, dapat kang makahanap ng naaangkop na kurso

Pagsasanay Hadoop Online Hakbang 3
Pagsasanay Hadoop Online Hakbang 3

Hakbang 3. Kumuha ng kurso sa antas ng pamantasan sa Coursera kung nais mo ng mas maraming teorya

Ang Coursera ay isang kilalang, iginagalang na mapagkukunan ng mga kurso sa pagprograma. Bagaman ang mga tagubilin sa pangkalahatan ay mas teoretikal at hindi nagsasama ng maraming mga tumatakbo na halimbawa, maaari kang magsanay sa tabi ng tutorial at gamitin ang mga proyekto sa kurso upang makakuha ng praktikal na karanasan.

  • Mahahanap mo ang kursong ito sa online sa
  • Nag-iiba ang gastos sa pagitan ng mga kurso, ngunit nag-aalok din ang Coursera ng isang opsyon sa tulong pinansyal sa mga kwalipikado.
Pagsasanay Hadoop Online Hakbang 4
Pagsasanay Hadoop Online Hakbang 4

Hakbang 4. Sundin ang isang libreng kurso sa Big Data University para sa isang pagpipilian na pang-gastos

Kung hindi mo nais na magbayad para sa isang kurso sa online, ang Big Data University ay isang mahusay na pagpipilian. Mayroon silang 2-bahagi na kurso, na unang nakatuon sa mga pangunahing kaalaman sa Hadoop, pagkatapos ay sa pag-program kasama ang Hadoop, at ginagawang madali ng online na format na pumunta sa iyong sariling bilis.

  • Mahahanap mo ang mga kursong ito sa
  • Nag-aalok sila ng maraming mga tutorial sa Ingles, pati na rin ang Japanese, Spanish, Portuguese, at Russian.
Pagsasanay Hadoop Online Hakbang 5
Pagsasanay Hadoop Online Hakbang 5

Hakbang 5. Maghanap ng mga walkthrough sa YouTube kung kailangan mo ng libre, tiyak na pagsasanay

Mayroong libu-libong mga video na ginawa upang ipaliwanag ang Hadoop at kung paano ito magagamit. Ang malawak na hanay ng mga video ay nagbibigay sa iyo ng kakayahang umangkop, plus libre ito. Kung nagkakaroon ka ng isang tukoy na problema, maghanap sa YouTube para sa isang video na gumagalaw sa iyo sa proseso.

Ang mga tutorial ng Hadoop ay dapat ding medyo madali upang makahanap, dahil ang "hadoop" ay isang natatanging termino para sa paghahanap

Pagsasanay Hadoop Online Hakbang 6
Pagsasanay Hadoop Online Hakbang 6

Hakbang 6. Gumamit ng mga libreng tutorial ng Yahoo kung nais mong magsanay sa isang virtual na halimbawa

Ang mga tutorial na ito ay pinaghiwalay sa 7 mga module, at itinuturo nila sa iyo sa pag-install at pagpapatakbo ng Hadoop mula sa simula pa lang. Ito ay isang mahusay na pagpipilian para sa pagsisipilyo sa mga tukoy na kasanayan kung medyo kalawangin sila.

Pagsasanay Hadoop Online Hakbang 7
Pagsasanay Hadoop Online Hakbang 7

Hakbang 7. Sumangguni sa dokumento ng Open Open IBM nang libre, malalim na mga tagubilin

Ito ay isang hindi kapani-paniwalang masusing, bukas na mapagkukunan ng PDF na dokumento na nilikha ng isang pagkukusa sa pagsasanay sa IBM. Maingat ka nitong dinadaan sa Hadoop, sunud-sunod, at nagbibigay ng malinaw na nakasulat na mga tagubilin.

Ang mga tagubiling ito ay gumagana rin nang maayos kapag ipinares sa isang live na demo tulad ng Cloudera

Paraan 2 ng 2: Paglipat sa Real-World Application

Pagsasanay Hadoop Online Hakbang 8
Pagsasanay Hadoop Online Hakbang 8

Hakbang 1. Itanong kung maaari mong ipatupad ang Hadoop sa trabaho upang magsanay sa totoong data

Maglagay ng isang kahilingan sa iyong boss o superbisor, o makipag-usap sa kanila nang paisa-isa tungkol sa pagdadala ng mga bagong kasanayang ito sa lugar ng trabaho. Ito ay lalong mahalaga kung ang iyong kumpanya ay nagbayad para sa anumang pagsasanay o kurso sa online.

Ang mas maaga mong pagsisimulang ipatupad ang mga kasanayang natutunan, mas mabilis mo silang makakapag-master

Pagsasanay Hadoop Online Hakbang 9
Pagsasanay Hadoop Online Hakbang 9

Hakbang 2. Maghanap ng mga simpleng proyekto upang magsanay ng iyong mga kasanayan

Pumili ng mga proyekto na medyo simple at mababa ang peligro, tulad ng pagbibilang at pagraranggo ng bilang ng mga pakikipag-ugnayan sa bawat ahente ng customer, tulad ng mga email at sesyon ng chat.

  • Ang ilang iba pang mga tunay na application ng data ay nagsasama ng pag-scan sa pamamagitan ng mga weblog para sa mga error o pagsubaybay sa mga channel ng social media para sa sentimiyento ng tatak.
  • Maaari ka ring magsanay sa sample na data mula sa mga site tulad ng https://www.kaggle.com/datasets o
Pagsasanay Hadoop Online Hakbang 10
Pagsasanay Hadoop Online Hakbang 10

Hakbang 3. Regular na suriin ang iyong code gamit ang maliit na mga subset upang mag-ehersisyo ang anumang mga bug

Bago patakbuhin ang buong hanay ng data, kumuha ng isang mas maliit na test dataset sa iyong lokal na makina at patakbuhin ito sa maraming iba't ibang mga mode. Halimbawa, maaari mong patakbuhin ito nang paulit-ulit sa pamamagitan ng Local Jobrunner Mode, pagkatapos ng Pseudo-Distraced Mode, at pagkatapos ay ang Fully-Distraced Mode.

  • Papayagan ka nitong makilala ang anumang mga pagkukulang o bug bago pa sila napalakas sa buong dataset.
  • Hinahayaan ka ng Local Jobrunner Mode na lokal na subukan at i-debug ang iyong Mapa at Bawasan ang code, Ginagaya ng Pseudo-Distraced Mode ang kapaligiran sa produksyon, at ang mode na Ganap na Naipamahagi ay tumingin sa iyong tunay na kumpol ng produksyon.
Pagsasanay Hadoop Online Hakbang 11
Pagsasanay Hadoop Online Hakbang 11

Hakbang 4. Gumamit ng isang 1-taong libreng pagsubok upang magsanay sa isang virtual na kapaligiran sa makina

Ang mga kumpanya tulad ng Amazon at Microsoft ay nag-aalok ng mga bayad na subscription para sa kanilang mga serbisyo sa kasanayan sa Hadoop. Ang virtual machine ng Amazon ay tinatawag na Amazon Web Service (AWS) at ang serbisyo ng Microsoft ay tinatawag na Microsoft Azure. Para sa parehong serbisyo, libre ang iyong unang taon kapag inilagay mo ang impormasyon ng iyong credit card.

Huwag kalimutang kanselahin ang subscription pagkatapos ng 1 taon upang maiwasan ang pagsingil

Mga Tip

  • Tandaan na ang Hadoop ay isang mas dalubhasa, makitid na paggamit ng wika sa programa. Tiyak na bibigyan ka nito ng isang gilid sa malaking mundo ng data, ngunit hindi palaging kinakailangan upang maging isang programmer.
  • Maaari mo ring basahin ang mga libro at artikulo tungkol sa Hadoop, tulad ng Hadoop: The Definitive Guide, 3rd Edition ni Tom White.

Inirerekumendang: