Kód kurzu: MOC 20773« Krok späť

Analýza veľkých dát pomocou Microsoft R

Kurz je určený pre dátových analytikov a špecialistov zodpovedných za spracovanie a analýzu dát so záujmom o strojové učenie, ktorí sa chcú zoznámiť s pokročilými možnosťami analýzy a vizualizácie dát pomocou jazyka R s využitím nástrojov Microsoft R. V rámci kurzu sa zoznámite s prostredím Microsoft R Serveru a Microsoft R klienta a naučíte sa ich použiť pre načítanie, transformáciu, analýzu a vizualizáciu dát. Dozviete sa tiež, ako optimalizovať výkon vašich výpočtov a ako vytvoriť vlastné prediktívne modely s použitím vhodných knižníc v jazyku R.

Neboli nájdené žiadne termíny, kontaktujte náš klientsky servis.
V prípade záujmu o iný termín uvedeného kurzu, kontaktujte klientsky servis, prosím.

PobočkaDníKatalógová cenaCena príručkyITB
Neboli nájdené žiadne záznamy.

*Cena kurzu je uvedená vrátane ceny originálnych štúdijních materiálú.

Pre koho je kurz určený

Kurz je cielený na dátových analytikov a špecialistov zodpovedných za spracovanie a analýzu dát.

Čo vás naučíme

 • Používať prostredie Microsoft R Server a Microsoft R Client
 • Načítať a analyzovať veľké dáta z rôznych zdrojov s pomocou jazyka R
 • Transformovať a čistiť uložené dáta
 • Vizualizovať dáta pomocou grafov
 • Zvýšiť výkon analytických úloh ich paralelizáciou
 • Vytvárať regresné modely a používať ich na výpočet predikcií
 • Používať jazyk R v prostredí Microsoft SQL Serveru

Požadované vstupné znalosti

 • Základná znalosť jazyka R
 • Základná znalosť bežne používaných balíčkov v jazyku R
 • Základná znalosť štatistických metód

Metódy výučby

Odborný výklad s praktickými ukážkami, cvičenia na počítačoch.

Študijné materiály

Doporučená je originálna príručka spoločnosti Microsoft, ktorá nie je zahrnutá v cene kurzu. Príručka je v anglickom jazyku.

Osnova kurzu

Modul 1: Microsoft R Server a Microsoft R Client
 • Zoznámenie sa s Microsoft R Server
 • Použitie Microsoft R klienta
 • Predstavenie funkcií Scaler
Modul 2: Prieskum veľkých dát
 • Naučíte sa preskúmať veľká dáta uložené v rôznych úložiskách vašej organizácie
 • Zoznámenie s dátovými zdrojmi Scaler
 • Načítanie dát do XDF objektov
 • Sumarizácia dát v XDF objektoch
Modul 3: Vizualizácia veľkých dát
 • Zoznámenie sa s vizualizáciou dát s pomocou grafov
 • Predstavenie príkazov ggplot, rxlinePlot a rxHistogram
 • Vizualizácia dát v pamäti
 • Vizualizácia veľkých dát
Modul 4: Spracovanie veľkých dát
 • Zoznámenie sa s transformáciou veľkých dát
 • Spojenie a radenie veľkých dátových kolekcií
 • Správa dátových kolekcií
 • Pripojenie sa k vzdialeným zdrojom dát
 • Ukážka transformácie dát s pomocou rxDataStep
Modul 5: paralelizácie analytických operácií
 • Vysvetlenie, ako pre urýchlenie výpočtovú úlohu rozdeliť do viacerých paralelných operácií
 • Použitie výpočtového kontextu RxLocalParallel vo funkcii rxExec
 • Zoznámenie sa s balíčkom revoPemaR
Modul 6: Vytváranie a používanie regresných modelov
 • Zoznámenie sa so zhlukovou analýzou veľkých dát
 • Tvorba regresných modelov
 • Použitie regresných modelov pre výpočet predikcií
Modul 7: Vytváranie a používanie partitioning modelov
 • Vytváranie partitioning modelov založených na rozhodovacích stromoch
 • Overovanie a testovanie modelov pomocou porovnávania výsledných predikcií
 • Zoznámenie s algoritmy rxDTree, rxDForest a rxBTree
Modul 8: Spracovanie veľkých dát v Microsoft SQL Server a Hadoop
 • Zoznámenie sa s použitím jazyka R v Microsoft SQL Serveru
 • Ukážka použitia Hadoop a prístupu Map / Reduce
 • Úvod do použitia Hadoop Spark

Predošlé kurzy

Nasledujúce kurzy

žiadny nadväzujúci kurz
Elektronická příručka MOC20773

Cena:
5650 CZK
Elektronická příručka MOC20773

Cena:
178 EUR
Uvedené ceny sú bez DPH.