Aktualizovaná verze 2016 překladové paměti DGT (DGT Translation Memory, DGT-TM) je nyní k dispozici ke stažení na stránce:
https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory.
DGT-TM tvoří součást překladové paměti evropských institucí vytvořené z „
Acquis Communautaire“ pro všech 24 úředních jazyků EU. Jde o produkt Generálního ředitelství pro překlady Evropské komise (DGT); distributorem je pak Společné výzkumné středisko (JRC).
Překladové paměti jsou zarovnané větné segmenty z manuálně vytvořených překladů. Lze je nahrát do CAT softwaru a využívat při překladatelské práci. Jedná se o rozsáhlý paralelní korpus v elektronické podobě, proto jej lze využít i v počítačové lingvistice, pro účely statistického strojového překladu či k tvorbě vícejazyčných slovníků.
Letošní aktualizací
DGT-TM-2016 se paměť rozšiřuje o
11 milionů překladových jednotek (184 milionů slov). Na každý jazyk tak připadá přibližně
480 tisíc nových překladových jednotek. Celkově tak paměť tvoří
100 milionů překladových jednotek.
Více informací o zdrojích jazykových technologií zde:
https://ec.europa.eu/jrc/en/language-technologies.