Zobrazit vše

Zpracování přirozeného jazyka

Kurz je zaměřen na analýzu a zpracování textů.
Úroveň
Určeno účastníkům se základními znalostmi a zkušenostmi
středně pokročilý
Délka kurzu
1 den
Jazyk
 cz  eu
Kód kurzu
PU21110285
Machine learning
Kategorie:
Chcete tento kurz na míru pro vaši firmu? Kontaktujte nás

Kurzy s lektorem

Termín
Jazyk
Místo
Forma
?
Jak a kde kurz probíhá.
Cena bez DPH
7. 4. 2025 09:00 - 17:00
Jazyk
Místo
Praha
Forma
učebna
?
Kurz probíhá prezenčně v učebně s lektorem.
Kód vybraného kurzu: PU21110285-0021
Cena bez DPH
4 990 Kč
7. 4. 2025 09:00 - 17:00
Jazyk
Místo
online
Forma
virtuální učebna
?
Kurz probíhá online přes počítač a ve stanoveném termínu, lektor je připojen vzdáleně.
Kód vybraného kurzu: PU21110285-0022
Cena bez DPH
4 990 Kč
Otevřený termín
?
Společně se domluvíme na konkrétním datu. Jedná se o nezávaznou objednávku.
Jazyk
Místo
Praha
Forma
učebna
?
Kurz probíhá prezenčně v učebně s lektorem.
Kód vybraného kurzu: PU21110285-0004
Cena bez DPH
4 990 Kč
Otevřený termín
?
Společně se domluvíme na konkrétním datu. Jedná se o nezávaznou objednávku.
Jazyk
Místo
Praha
Forma
učebna
?
Kurz probíhá prezenčně v učebně s lektorem.
Kód vybraného kurzu: PU21110285-0005
Cena bez DPH
4 990 Kč

Popis kurzu

Předpokládá se znalost principů strojového učení, ale ty nejdůležitější koncepty budou stručně zopakovány. Specifikem zpracování textů je způsob předzpracování dat a jejich vektorizace. Tomu bude věnována první část. Vše bude prakticky vyzkoušeno na úloze, jejíž cílem je klasifikace textových dokumentů. Dále se účastníci dozvědí, co jsou to jazykové modely a jak je použít pro detekci jazyka dokumentu nebo generování textů.

Požadované znalosti

  • Základní znalost programování v Pythonu
  • Středoškolské znalosti lineární algebry, matematické analýzy a teorie pravděpodobnosti. Bude předpokládáno základní porozumění pojmům jako vektor, matice, vektorový prostor, pravděpodobnost, podmíněná pravděpodobnost, nezávislost náhodných jevů a znalost násobení matic a derivace funkcí.
  • Znalosti strojového učení na úrovni kurzu Úvod do strojového učení.

Obsah kurzu

  • Úvod do zpracování přirozeného jazyka
  • Vybrané kapitoly z komputační ligvistiky (korpusy, tokenizace, morfologická, syntaktická a sémantická analýza, entropie, mutual information, perplexita)
  • Vektorizace textových dokumentů (bag of words, one-hot encoding, TF-IDF)
  • Word embedding (word2vec)
  • Praktická úloha na klasifikaci textů
  • Word embedding (vytvoření word2vec modelů a experimenty s vektorovými reprezentacemi slov)
  • Úvod do jazykových modelů (n-gramové modely, vyhlazování, modely založené na neuronových sítích)
  • Praktická úloha na jazykové modelování (implementace jazykových modelů a jejich využití pro detekci jazyka textu)
  • Úprava algoritmu pro generování textů

Lektoři

Jiří Materna
Jiří Materna

Je specialista na strojové učení se zkušenostmi s jeho aplikacemi v průmyslu od roku 2007. Mezi lety 2008 a 2017 pracoval ve společnosti Seznam.cz, z toho posledních 7 let jako vedoucí výzkumného oddělení. Nyní pracuje na volné noze, nabízí vývoj machine learning řešení na míru, organizuje konferenci Machine Learning Prague a píše blog ML Guru.

Chcete tento kurz na míru pro vaši firmu?

Kontaktujte nás

Aktuality ke kurzu

Náhledový obrázek novinky
Microsoft 365 6. 11. 2024
3 tipy pro úspěšné čerpání dotací s DIGI pro firmu

Zeptali jsme se našeho klienta, společnosti Akcenta, na jejich zkušenosti s programem DIGI pro firmu. Kristýna Stárková, která v Akcentě pracuje jako People & Culture Specialist a celým procesem úspěšně prošla, se s námi podělila o tři doporučení.

Náhledový obrázek novinky
Microsoft 365 15. 8. 2024
DIGI pro firmu: Ukázkové kalkulace a nejčastější dotazy

Vzdělávání zaměstnanců je díky rostoucí digitalizaci klíčové. Jak ho ale efektivně financovat? Program DIGI pro firmu nabízí příležitost, jak získat dotace na IT kurzy a ušetřit tak firemní rozpočet. Pojďme se podívat na ukázkové kalkulace a nejčastější otázky, se kterými se setkáváme.

Náhledový obrázek novinky
Machine Learning 18. 3. 2023
Hlavní rozdíly mezi strojovým učením a umělou inteligencí

Strojové učení (ML) a umělá inteligence (AI) jsou příbuzné obory, ale není to totéž. Umělá inteligence je širší obor, který zahrnuje mnoho různých technologií, včetně strojového učení. Přečtěte si, jaké jsou kllíčové rozdíly mezi strojovým učením a umělou inteligencí.

Předchozí kurzy

Chcete tento kurz na míru pro vaši firmu?

Kontaktujte nás

Aktuality ke kurzu

Náhledový obrázek novinky
Microsoft 365 6. 11. 2024
3 tipy pro úspěšné čerpání dotací s DIGI pro firmu

Zeptali jsme se našeho klienta, společnosti Akcenta, na jejich zkušenosti s programem DIGI pro firmu. Kristýna Stárková, která v Akcentě pracuje jako People & Culture Specialist a celým procesem úspěšně prošla, se s námi podělila o tři doporučení.

Náhledový obrázek novinky
Microsoft 365 15. 8. 2024
DIGI pro firmu: Ukázkové kalkulace a nejčastější dotazy

Vzdělávání zaměstnanců je díky rostoucí digitalizaci klíčové. Jak ho ale efektivně financovat? Program DIGI pro firmu nabízí příležitost, jak získat dotace na IT kurzy a ušetřit tak firemní rozpočet. Pojďme se podívat na ukázkové kalkulace a nejčastější otázky, se kterými se setkáváme.

Náhledový obrázek novinky
Machine Learning 18. 3. 2023
Hlavní rozdíly mezi strojovým učením a umělou inteligencí

Strojové učení (ML) a umělá inteligence (AI) jsou příbuzné obory, ale není to totéž. Umělá inteligence je širší obor, který zahrnuje mnoho různých technologií, včetně strojového učení. Přečtěte si, jaké jsou kllíčové rozdíly mezi strojovým učením a umělou inteligencí.

Proč s námi