Augmenting Statistical Data Dissemination by Short Quantified Sentences of Natural Language

Dáta z Národného štatistického inštitútu sú považované za dôležitý zdroj dôveryhodných informácií pre rôznych užívateľov. Sumarizácia a rozšírenie pomocou tradičných metód je praktický prístup na poskytovanie tejto evidencie. Potenciál zhrnutí vyjadrených v krátkych kvantifikovaných vetách. Zhrnutia...

Full description

Saved in:
Bibliographic Details
Main Author: Hudec, Miroslav, 1969-
Other Authors: Bednárová, Erika, Holzinger, Andreas
Format: Book Chapter
Language:English
Subjects:
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Dáta z Národného štatistického inštitútu sú považované za dôležitý zdroj dôveryhodných informácií pre rôznych užívateľov. Sumarizácia a rozšírenie pomocou tradičných metód je praktický prístup na poskytovanie tejto evidencie. Potenciál zhrnutí vyjadrených v krátkych kvantifikovaných vetách. Zhrnutia zahŕňajúce napr. "väčšina návštev zo vzdialených krajín má krátku dobu trvania" môžu byť hneď pochopené rôznymi užívateľmi. Lingvistické zhrnutia nie sú zamerané na náhradu existujúcich diseminačných prístupov, ale môžu byť rozšírené poskytnutím alternatív v prospech rôznych užívateľov oficiálnych štatistík. Lingvistické zhrnutie možno dosiahnuť pomocou matematickej formalizácie lingvistických podmienok a kvantifikátorov nejasných množín. Na vyhýbanie sa zhrnutí založených na odľahlých hodnotách, alebo údajoch s nízkym pokrytím, je aplikované kritérium kvality. Koncept založený na lingvistických zhrnutiach je demonštrovaný na testovacích rozhraniach, interpretujúcich zhrnutia zo skutočných štatistických údajov.