This site uses cookies.
Some of these cookies are essential to the operation of the site,
while others help to improve your experience by providing insights into how the site is being used.
For more information, please see the ProZ.com privacy policy.
Asi víte, co to je token. Je slovo v některém z možných tvarů. V tištěných slovnících bývají hesla a někdy obsahují i další možné tvary. V textu vidíme většinou tvary, které se od slovníkového hesla liší.
Asi víte, co to je token. Je slovo v některém z možných tvarů. V tištěných slovnících bývají hesla a někdy obsahují i další možné tvary. V textu vidíme většinou tvary, které se od slovníkového hesla liší.
jsem uvedl odkaz na moji prezentaci o slovníku Valodas, jedna odrážka uvádí
- jak využít data ze slovníků StarDict.
Dnes jsem funkci konverze slovníku StarDict do .CSV použil pro konverzi čínsko-anglického slovníku pro konverzi do .TXT. Chtěl jsem vyzkoušet funkci tokenizéru pro čínštinu v OmegaT. OmegaT nebyla schopna rozpoznat velký počet slov (skládají se z různého počtu znaků) a potom zobrazit jejich výskyt a překlad v okně slovníku.
StarDict Editor mi slovník do .TXT nepřevedl a tak jsem udělal konverzi pomocí programu Valodas. OmegaT jednotlivá slova v čínské textu rozpoznává a zobrazuje je a také jejich překlad v okně glosáře. Nyní si mohu v OmegaT listovat čínskými PDF soubory a se seznámit se s příručkami o programu Heartsome, které jsou pouze v angličtině a v čínštině.
Pro většinu našich překladatelů mají tokenizéry význam, když překládají texty ze zdrojového slovanského nebo ugrofinského jazyka a přitom používají glosář. Tokenizéry jsou součástí programu OmegaT.
Pro většinu našich překladatelů mají tokenizéry význam, když překládají texty ze zdrojového slovanského nebo ugrofinského jazyka a přitom používají glosář. Tokenizéry jsou součástí programu OmegaT.
Milan
Udělal jsem prezentaci pro porovnání projektů, které povolují doplňovat na webech terminologii, použít staženou terminologii ve svých nástrojích a přidal jsem odkaz na TaaS, který má v budoucnosti pokrývat terminologii oficiálních jazyků států EU a ruštinu. Taas obsahuje hodně anglických a lotyšských termínů.
Pro demonstrování rozdílů jsem překladači "přeložil" deset vět z angličtiny do češtiny. V OmegaT jsem nepoužil slovník.
OmegaT nepoužívá ve slovnících tokenizér pro rozpoznávání terminologie. Používá jej pouze v glosářích. Slovníky mohou být rozsáhlé, glosáře by měly být úzce specializované. Zobrazené terminologie je příliš hodně.
Milan
Subject:
Comment:
The contents of this post will automatically be included in the ticket generated. Please add any additional comments or explanation (optional)
Pastey is an innovative desktop application that bridges the gap between human expertise and artificial intelligence. With intuitive keyboard shortcuts, Pastey transforms your source text into AI-powered draft translations.
Manage your TMs and Terms ... and boost your translation business
Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.