Analysis of Semantic Relationships in Ukrainian Text Content Based on Word2Vec and Machine Learning
Štúdia použila korpus ukrajinských textov z kníh od rôznych autorov na trénovanie modelu Word2Vec na identifikáciu sémantických vzťahov medzi slovami. Cieľom projektu je analyzovať sémantické vzťahy medzi slovami a skonštruovať vektorové reprezentácie slov pomocou metódy Word2vec. Úlohy výskumu zahŕ...
Saved in:
| Main Author: | |
|---|---|
| Other Authors: | , , , , |
| Format: | Book Chapter |
| Language: | English |
| Subjects: | |
| Tags: |
No Tags, Be the first to tag this record!
|
| Summary: | Štúdia použila korpus ukrajinských textov z kníh od rôznych autorov na trénovanie modelu Word2Vec na identifikáciu sémantických vzťahov medzi slovami. Cieľom projektu je analyzovať sémantické vzťahy medzi slovami a skonštruovať vektorové reprezentácie slov pomocou metódy Word2vec. Úlohy výskumu zahŕňajú prípravu dát, trénovanie modelu, analýzu získaných vektorov a porovnanie výsledkov s existujúcimi metódami. Hlavnými výzvami projektu sú veľké množstvá vysokokvalitných súborov údajov v ukrajinskom jazyku na trénovanie modelu, vytvorenie efektívneho algoritmu učenia Word2vec a vývoj používateľského rozhrania. Pomocou Pythonu a TensorFlow sa dosiahne efektívna aplikácia metódy Word2vec, ktorá vykazuje vysoký výkon. Beží približne 2,8 sekundy a využíva obmedzené množstvo pamäte v rozsahu od 140 do 200 megabajtov. |
|---|