Metódy analýzy webového obsahu: Výstup národného projektu „IT Akadémia – vzdelávanie pre 21. storočie“
Keywords:
web mining, NLPSynopsis
Cieľom vysokoškolskej učebnice je poukázať na význam a dôležitosť analýzy textu a uviesť niektoré dôležité aplikácie tejto oblasti. Naším zámerom je uviesť viaceré metódy používané v oblasti, zhrnúť ich základné charakteristiky, poukázať na silné a slabé stránky týchto metód. V publikácii sa venujeme základným metódam v oblasti, napr. extrakcia textu z webových stránok, tokenizácia textu, stop slová, analýza početnosti slov, modely pre reprezentáciu dokumentu, metriky podobnosti dokumentov atď. Tieto oblasti sú často označované jednotným pojmom spracovanie prirodzeného jazyka (Natural Language Processing), pod ktorý zaraďujeme akýkoľvek výpočet alebo manipuláciu s prirodzeným jazykom pre získanie pohľadu na pochopenie slov alebo konštrukciu viet. Pozornosť je tiež venovaná hlavne praktickým aplikáciám analýzy obsahu webových stránok, z ktorých sa v súčasnosti vytvorili prakticky samostatné výskumné oblasti ako napr. analýza sentimentu, topic mining, identifikácia fake news, morfologická a syntaktická analýza textu a podobne.

Downloads
Forthcoming
Series
Categories
License

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.