Kód kurzu: MOC 20773« Krok späť

Analýza veľkých dát pomocou Microsoft R

Kurz je určený pre dátových analytikov a špecialistov zodpovedných za spracovanie a analýzu dát so záujmom o strojové učenie, ktorí sa chcú zoznámiť s pokročilými možnosťami analýzy a vizualizácie dát pomocou jazyka R s využitím nástrojov Microsoft R. V rámci kurzu sa zoznámite s prostredím Microsoft R Serveru a Microsoft R klienta a naučíte sa ich použiť pre načítanie, transformáciu, analýzu a vizualizáciu dát. Dozviete sa tiež, ako optimalizovať výkon vašich výpočtov a ako vytvoriť vlastné prediktívne modely s použitím vhodných knižníc v jazyku R.

Neboli nájdené žiadne termíny, kontaktujte náš klientsky servis.
V prípade záujmu o iný termín uvedeného kurzu, kontaktujte klientsky servis, prosím.

PobočkaDníKatalógová cenaCena príručkyITB
Praha3 22 750 CZK v cene kurzu 30
Brno3 22 750 CZK v cene kurzu 30
Bratislava3 630,00 EUR 178,00 EUR 30

Pre koho je kurz určený

Kurz je cielený na dátových analytikov a špecialistov zodpovedných za spracovanie a analýzu dát.

Čo vás naučíme

  • Používať prostredie Microsoft R Server a Microsoft R Client
  • Načítať a analyzovať veľké dáta z rôznych zdrojov s pomocou jazyka R
  • Transformovať a čistiť uložené dáta
  • Vizualizovať dáta pomocou grafov
  • Zvýšiť výkon analytických úloh ich paralelizáciou
  • Vytvárať regresné modely a používať ich na výpočet predikcií
  • Používať jazyk R v prostredí Microsoft SQL Serveru

Požadované vstupné znalosti

  • Základná znalosť jazyka R
  • Základná znalosť bežne používaných balíčkov v jazyku R
  • Základná znalosť štatistických metód

Metódy výučby

Odborný výklad s praktickými ukážkami, cvičenia na počítačoch.

Študijné materiály

Doporučená je originálna príručka spoločnosti Microsoft, ktorá nie je zahrnutá v cene kurzu. Príručka je v anglickom jazyku.

Osnova kurzu

Modul 1: Microsoft R Server a Microsoft R Client
  • Zoznámenie sa s Microsoft R Server
  • Použitie Microsoft R klienta
  • Predstavenie funkcií Scaler
Modul 2: Prieskum veľkých dát
  • Naučíte sa preskúmať veľká dáta uložené v rôznych úložiskách vašej organizácie
  • Zoznámenie s dátovými zdrojmi Scaler
  • Načítanie dát do XDF objektov
  • Sumarizácia dát v XDF objektoch
Modul 3: Vizualizácia veľkých dát
  • Zoznámenie sa s vizualizáciou dát s pomocou grafov
  • Predstavenie príkazov ggplot, rxlinePlot a rxHistogram
  • Vizualizácia dát v pamäti
  • Vizualizácia veľkých dát
Modul 4: Spracovanie veľkých dát
  • Zoznámenie sa s transformáciou veľkých dát
  • Spojenie a radenie veľkých dátových kolekcií
  • Správa dátových kolekcií
  • Pripojenie sa k vzdialeným zdrojom dát
  • Ukážka transformácie dát s pomocou rxDataStep
Modul 5: paralelizácie analytických operácií
  • Vysvetlenie, ako pre urýchlenie výpočtovú úlohu rozdeliť do viacerých paralelných operácií
  • Použitie výpočtového kontextu RxLocalParallel vo funkcii rxExec
  • Zoznámenie sa s balíčkom revoPemaR
Modul 6: Vytváranie a používanie regresných modelov
  • Zoznámenie sa so zhlukovou analýzou veľkých dát
  • Tvorba regresných modelov
  • Použitie regresných modelov pre výpočet predikcií
Modul 7: Vytváranie a používanie partitioning modelov
  • Vytváranie partitioning modelov založených na rozhodovacích stromoch
  • Overovanie a testovanie modelov pomocou porovnávania výsledných predikcií
  • Zoznámenie s algoritmy rxDTree, rxDForest a rxBTree
Modul 8: Spracovanie veľkých dát v Microsoft SQL Server a Hadoop
  • Zoznámenie sa s použitím jazyka R v Microsoft SQL Serveru
  • Ukážka použitia Hadoop a prístupu Map / Reduce
  • Úvod do použitia Hadoop Spark

Predošlé kurzy

Nasledujúce kurzy

žiadny nadväzujúci kurz
Elektronická příručka MOC20773

Cena:
5650 CZK
Elektronická příručka MOC20773

Cena:
178 EUR
Uvedené ceny sú bez DPH.