V tomto kurze nadviažeme na základný kurz Spracovanie prirodzeného jazyka pokročilejšími témami. Zameriame sa hlavne na predspracovanie dát a najnovšie aplikácie hlbokého učenia v spracovaní textu. Bude sa jednať predovšetkým o architektúry [...]
  • MLC_NLPA
  • Dĺžka 1 deň
  • 0 ITK bodov
  • 0 termínov
  • Bratislava (200 €)

    Brno (na vyžiadanie)

    Praha (4 990 Kč)

V tomto kurze nadviažeme na základný kurz Spracovanie prirodzeného jazyka pokročilejšími témami. Zameriame sa hlavne na predspracovanie dát a najnovšie aplikácie hlbokého učenia v spracovaní textu. Bude sa jednať predovšetkým o architektúry neurónových sietí postavených na tzv. Transformeroch. S využitím metódy transfer learningu ukážeme, ako možno využiť veľké predtrénované neurónové siete pre najrôznejšie praktické aplikácie.

»
  • Základná znalosť programovania v Pythone
  • Stredoškolská matematika
  • Znalosti strojového učenia na úrovni kurzu Úvod do strojového učenia
  • Znalosti na úrovni kurzu Spracovanie prirodzeného jazyka

Študijný materiál spoločnosti Machine Learning College.

  • Predspracovanie textových dát
    • Kódovanie znakov a normalizácia Unicode
    • Tradičná tokenizácia (jednoduché metódy, Spacy, Moses)
    • Subword tokenizácia (byte-pair kódovanie, wordpiece, sentencepiece)
    • Čistenie dát (duplikácia, odstránenie textového balastu)
  • Word embeddings
    • Všeobecné princípy
    • Implementácia skip-gram modelu
  • Strojový preklad s rekurentnými sieťami
    • Pamäťové bunky LSTM a GRU
    • Implementácia strojového prekladu pomocou rekurentných sietí
  • Transformery
    • Attention is all you need
    • Architektúra transformeru
    • GPT2
    • BERT
    • XLNET
  • Príklady transfer learningu pre spracovanie prirodzeného jazyka
    • Klasifikácia textov
    • Rozpoznanie menovitých entít
    • Question answering
Aktuálna ponuka
Školiace miesto
Jazyk kurzu

Uvedené ceny sú bez DPH.