Laboratórium spracovania prirodzeného jazyka

Vedecké zameranie laboratória

NLP Lab pri Katedre informatiky bolo založené v roku 2021 s cieľom vytvoriť priestor pre interdisciplinárny základný a aplikovaný výskum v oblasti spracovania prirodzeného jazyka a zároveň pomocou najmodernejšej infraštruktúry podporiť vzájomnú spoluprácu výskumníkov z Katedry informatiky s inými pracoviskami v rámci domácich a zahraničných inštitúcií.

NLP Lab realizuje výskum v oblasti spracovania prirodzeného jazyka a počítačovej lingvistiky. V súčasnosti sa rieši široká škála projektov zameraných hlavne na:

  • neurónový strojový preklad (NMT), hodnotenie kvality strojového prekladu a odhad kvality,
  • získavanie znalostí zo štruktúrovaných a neštruktúrovaných dát,
  • metódy prípravy údajov pre klasifikáciu falošných správ zameraných na morfologickú a syntaktickú analýzu,
  • extrakciu znalostí z textov pre úlohy klasifikácie riešené pomocou neurónových sietí,
  • využitie lexikálnej databázy WordNet pre úlohy klasifikácie,
  • aplikáciu metód spracovania prirodzeného jazyka pre včasnú detekciu Alzheimerovej choroby a iných neurodegeneratívnych ochorení,
  • vytvorenie vhodnej architektúry pre spracovanie veľkých dát a pre spracovanie vybraných úloh NLP.

V rámci NLP Lab pôsobia aj doktorandi programu Aplikovaná informatika, ktorých témy dizertačných prác korešpondujú s vedeckým zameraním laboratória.

NLP Lab intenzívne spolupracuje s jazykovými katedrami v rámci filozofických fakúlt na Slovensku napr. Univerzity Konštantína Filozofa v Nitre, Univerzity sv. Cyrila a Metoda v Trnave a Univerzity Komenského v Bratislave. NLP Lab nadviazalo spoluprácu s pracoviskami orientujúcimi sa na obdobnú oblasť výskumu, konkrétne s Ústavom českého jazyka na Masarykovej univerzite a s Centrom pre vedu a výskumu na Univerzite v Pardubiciach. 

Ponuka analýz pre komerčnú i nekomerčnú prax

NLP Lab disponuje potrebným hardvérovým a softvérovým vybavením a poskytuje dostatočnú výpočtovú kapacitu pre spracovanie veľkého objemu štruktúrovaných a neštruktúrovaných dát. V rámci softwarového vybavenia je to profesionálny data miningový nástroj Statistica Data Miner a knižnice jazyka Python pre NLP a strojové učenie.

Projekty

Vznik a následná činnosť NLP Labu bola a je podporená nasledovnými vedeckými projektami:

  • APVV-18-0473 - Klasifikačný model chybovosti strojového prekladu: krok k objektívnejšiemu hodnoteniu kvality prekladu (2019-2023)
  • VEGA 1/0792/21 - Komparatívna evalvácia strojového prekladu do slovenčiny: štatistický vs. neurónový strojový preklad (2021)
  • VEGA 1/0821/21 - Pilier 3 - verifikácia účinnosti revízií zverejňovaných informácií komerčnými bankami v období očakávanej COVID-19 ekonomickej krízy (2021-2023)
  • OPVaI ITMS 313011T527 - Falošné informácie v prostredí Internetu - identifikácia, analýza obsahu, emócie (2020-2021)

Publikácie

Hudecová, E., Stahl, J., Benkova, L. & Munkova, D. (2024). Qualität des Posteditierens von maschinell erstellten Übersetzungen technischer Texte aus dem Slowakischen ins Deutsche durch erstsprachig slowakische Posteditoren. ZEITSCHRIFT FÜR SLAWISTIK, 69(1), 27-49. 2022IF: 0.2, Q3 - JCR  https://doi.org/10.1515/slaw-2024-0002

Munkova, D., Stranovska, E., Munk, M. (2024).  Communication models in a foreign language in relation to cognitive style category width and power distance, FRONTIERS IN PSYCHOLOGY, Frontiers, 14.

2022IF: 3.8, Q1 - JCR, Q1 - SJR https://www.frontiersin.org/articles/10.3389/fpsyg.2023.1272370

Boltiziar, J., Munkova, D. (2023). Emergency remote teaching of listening comprehension using YouTube videos with captions. EDUCATION AND INFORMATION TECHNOLOGIES, Springer, 2022IF: 5.5, Q1 - JCR, Q1 - SJR  https://doi.org/10.1007/s10639-023-12282-7

Forgac, F., Munkova, D., Munk, M., Kelebercova, L. (2023). Evaluating automatic sentence alignment approaches on English-Slovak sentences. SCIENTIFIC REPORTS, Nature, 13(1), 20123.

2022IF: 4.6, Q2 - JCR, Q1 - SJR https://doi.org/10.1038/s41598-023-47479-w

Stahl, J., Munkova, D., Benko, L., Hudecova, E. (2023). Maschinelle, posteditierte und menschliche Übersetzung publizistischer und populärwissenschaftlicher Texte aus dem Slowakischen ins Deutsche. LEBENDE SPRACHEN, De Gruyter, 68(2), 259-282.

2022: Q2 - SJR https://doi.org/10.1515/les-2022-1039

Munkova, D., Panisova, L., Welnitzova, K. (2023). A human evaluation of English-Slovak machine translation, Perspectives, Taylor and Francis, 31(6), 1142-1161

2022IF: 1.3, Q2 - JCR, Q1 - SJR https://doi.org/10.1080/0907676X.2022.2116989

Hajek, P., Munk, M. (2023). Speech emotion recognition and text sentiment analysis for financial distress prediction. NEURAL COMPUTING & APPLICATIONS, Springer, 35(29), 21463-21477.
2022IF: 6.000, Q2 - JCR, CCC, Q1 - SJR https://doi.org/10.1007/s00521-023-08470-8

Nagy, K.S., Kapusta, J., Munk, M. (2023). Feature extraction from unstructured texts as a combination of the morphological and the syntactic analysis and its usage in fake news classification tasks. NEURAL COMPUTING & APPLICATIONS, Springer, 35(29), 22055-22067.
2022IF: 6.000, Q2 - JCR, CCC, Q1 - SJR https://doi.org/10.1007/s00521-023-08967-2

Halvonik, D., Kapusta, J., Munk, M. (2023). Improve estimated time-on-task calculation in a Virtual Learning Environment. INTERACTIVE LEARNING ENVIRONMENTS, Routledge, 31(5), 2914-2929.
2022IF: 5.400, Q1 - JCR, CCC, Q1 - SJR https://doi.org/10.1080/10494820.2021.1913609

Sunny, F.A., Hajek, P., Munk, M., Abedin M.Z., Satu, M.S., Efat, M.I.A., Islam M.J. (2022). A Systematic Review of Blockchain Applications. IEEE ACCESS, IEEE, 10, 59155-59177.
2022IF: 3.900, Q2 - JCR, CCC, Q1 - SJR https://doi.org/10.1109/ACCESS.2022.3179690

Wrede, O., Munkova, D., Banik, T., Munk, M. (2022). Zur Erforschung von Korrelationen zwischen verschiedenen Fehlertypen bei der maschinellen Übersetzung aus dem Deutschen ins Slowakische. Lebende Sprachen, De Gruyter, 67(2), 432-456.

2022: Q2 - SJR https://doi.org/10.1515/les-2022-1032

Munkova, D., Munk, M., Benko, L., Stastny, J. (2021). MT evaluation in the context of language complexity. COMPLEXITY, Wiley-Hindawi, 2021, 2806108. 
2021IF: 2.121, Q2 - JCR, Q1 - SJR https://doi.org/10.1155/2021/2806108

Munkova, D., Munk, M., Welnitzova, K., Jakabovicova, J. (2021). Product and process analysis of machine translation into the inflectional language. SAGE OPEN, Sage, 11(4), 21582440211054501.
2021IF: 2.032, Q2 - JCR, CCC, Q2 - SJR https://doi.org/10.1177/21582440211054501

Munkova, D., Munk, M., Benko, L., Hajek, P. (2021). The role of automated evaluation techniques in online professional translator training. PEERJ COMPUTER SCIENCE, PeerJ, 7, e706.
2021IF: 2.411, Q2 - JCR, CCC, Q2 - SJR https://doi.org/10.7717/peerj-cs.706

Kapusta, J., Benko, L., Munkova, D., Munk, M. (2021). Analysis of Edit Operations for Post-editing Systems. INTERNATIONAL JOURNAL OF COMPUTATIONAL INTELLIGENCE SYSTEMS, Springer, 14(1), 197.
2021IF: 2.259, Q3 - JCR, CCC, Q2 - SJR https://doi.org/10.1007/s44196-021-00048-3

Drlik, M., Munk, M., Skalka, J. (2021).  Identification of Changes in VLE Stakeholders' Behavior Over Time Using Frequent Patterns Mining.  IEEE ACCESS, IEEE, 9, 23795-23813.
2021IF: 3.476, Q2 - JCR, CCC, Q1 - SJR https://doi.org/10.1109/ACCESS.2021.3056191

Kapusta, J., Drlik, M., Munk, M. (2021). Using of N-grams From Morphological Tags for Fake News Classification. PEERJ COMPUTER SCIENCE, PeerJ, 7, e624.
2021IF: 2.411, Q2 - JCR, CCC, Q2 - SJR https://doi.org/10.7717/peerj-cs.624

Nagy, K., Kapusta, J. (2021). Improving fake news classification using dependency grammar. PLOS ONE, Public Library of Science, 16(9), e0256940.
2021IF: 3.752, Q2 - JCR, Q1 - SJR https://doi.org/10.1371/journal.pone.0256940

Pilkova, A., Munk, M., Benko, L., Blazekova, P., Kapusta, J. (2021). Pillar 3: Does banking regulation support stakeholders' interest in banks financial and risk profile? PLOS ONE, Public Library of Science, 16(10), e0258449.
2021IF: 3.752, Q2 - JCR, Q1 - SJR https://doi.org/10.1371/journal.pone.0258449

Munk, M., Pilkova, A., Benko, L., Blazekova, P., Svec, P. (2021). Web usage analysis of Pillar 3 disclosed information by deposit customers in turbulent times. EXPERT SYSTEMS WITH APPLICATIONS, Elsevier, 185, 115503. 
2021IF: 8.665, Q1 - JCR, CCC, Q1 - SJR https://doi.org/10.1016/j.eswa.2021.115503

Hajek, P., Barushka, A., Munk, M. (2021). Neural Networks with Emotion Associations, Topic Modeling and Supervised Term Weighting for Sentiment Analysis. INTERNATIONAL JOURNAL OF NEURAL SYSTEMS, World Scientific, 31(10), 2150013. 
2021IF: 6.325, Q1 - JCR, CCC, Q1 - SJR https://doi.org/10.1142/S0129065721500131

Vedúca laboratória

prof. RNDr. Daša Munková, PhD.
Katedra informatiky
Fakulta prírodných vied a informatiky UKF v Nitre
Tr. A. Hlinku 1
949 01 Nitra
tel. 037 6408 722
e-mail: dmunkova@ukf.sk

Image
Image

Táto webová stránka používa cookies.

Pokračovaním v prehliadaní si tejto webovej stránky bez zmeny nastavenia vášho webového prehliadača pre súbory cookie súhlasíte s používaním cookies. Dozvedieť sa viac

Rozumiem

V týchto zásadách používame výraz "cookies" ako odkaz na súbory cookies a iné podobné technológie, na ktoré sa vzťahuje smernica EÚ o ochrane súkromia v elektronických komunikáciách.

Čo je cookie?

Cookies sú malé textové súbory vytvorené navštívenou webovou stránkou obsahujúce údaje. Ukladajú sa do počítača návštevníka, aby umožnili užívateľovi prístup k rôznym funkciám. Na našich stránkach sa spolu so súbormi cookie relácií používajú aj iné trvalé súbory cookies. Súbory cookie relácie sú dočasne uložené v pamäti počítača, pokiaľ si návštevník prehliada webové stránky. Tieto súbory cookie sa vymažú, keď užívateľ zatvorí webový prehliadač alebo po uplynutí určitej doby (čo znamená, že relácia vyprší). Trvalé súbory cookie zostávajú v počítači návštevníka až do ich vymazania.

Prečo používame cookies?

Súbory cookies používame na to, aby sme sa dozvedeli viac o tom, ako návštevníci komunikujú s našim obsahom a pomáhajú nám zlepšiť zážitok pri návšteve našich webových stránok.

Funkčnosť a obsah stránky

Funkciu zdieľania používajú návštevníci, aby odporučili naše stránky a obsah na sociálnych sieťach, ako je Facebook a Twitter. Súbory cookie ukladajú informácie o tom, ako návštevníci používajú funkciu zdieľania, i keď nie individuálnej úrovni, aby bolo možné danú webovú stránku zlepšiť. Ak neprijmete súbory cookies, neuložia sa žiadne informácie. Na niektoré ďalšie funkcie na našich webových stránkach používame tretie strany, napríklad ak navštívite stránky s vloženými videami z YouTube alebo stránky, ktoré obsahujú odkazy na YouTube. Tieto videá alebo odkazy (a iný obsah od tretích strán) môžu obsahovať súbory cookies tretích strán a možno že si budete chcieť pozrieť zásady webových stránok týchto tretích strán ohľadne informácií týkajúcich ich používania súborov cookies.

Analytika webovej stránky

Táto webová stránka používa Google Analytics, ktorá používa súbory cookies. Vo všeobecnosti súbory cookies ukladajú informácie o tom, ako návštevníci používajú webové stránky, vrátane počtu zobrazených stránok, odkiaľ návštevníci pochádzajú a počet návštev za účelom zlepšenia webovej stránky a poskytnutia užívateľom dobré skúsenosti. Ak neprijmete súbory cookies, neuložia sa žiadne informácie.

Ako odmietnem a vymažem cookies?

Súbory cookies nepoužijeme na zhromažďovanie identifikovateľných informácií o návštevníkovi. Avšak v prípade, že tak budete chcieť urobiť, môžete si vybrať a odmietnuť alebo zablokovať cookies, ktoré nastavila spoločnosť Electrolux alebo webové stránky tretích strán tým, že zmeníte nastavenia vášho prehliadača. Ohľadne ďalších podrobností pozri „funkcia pomoc“. Vezmite na vedomie, že väčšina prehliadačov automaticky akceptuje cookies, takže ak si neprajete používať cookies, bude potrebné ich aktívne vymazať alebo zablokovať. Informácie o používaní cookies v prehliadačoch v mobilných telefónoch a podrobnosti, ako odmietnuť alebo vymazať takéto cookies, nájdete v príručke vášho mobilného telefónu. Majte na pamäti, že ak odmietne používanie cookies, naše stránky budete môcť navštíviť, avšak niektoré funkcie nemusia fungovať správne.