Difference between revisions of "Common Translation Errors in Wikipedia Articles: a Corpus-Based Study"
(Links) |
(Adding infobox) |
||
Line 1: | Line 1: | ||
+ | {{Infobox work | ||
+ | | title = Common Translation Errors in Wikipedia Articles: a Corpus-Based Study | ||
+ | | date = 2017 | ||
+ | | authors = [[Adéla Štromajerová]] | ||
+ | | link = https://theses.cz/id/dtgdfv/ | ||
+ | }} | ||
'''Common Translation Errors in Wikipedia Articles: a Corpus-Based Study''' - scientific work related to [[Wikipedia quality]] published in 2017, written by [[Adéla Štromajerová]]. | '''Common Translation Errors in Wikipedia Articles: a Corpus-Based Study''' - scientific work related to [[Wikipedia quality]] published in 2017, written by [[Adéla Štromajerová]]. | ||
== Overview == | == Overview == | ||
Tato prace se zabýva běžnými chybami v překladech clanků na Wikipedii. Pro analýzu bylo využito paralelniho korpusu English/Czech [[Wikipedia]] Parallel Corpus. Na zakladě několika zdrojů byly identifikovany chyby, ktere by se potencialně mohly v korpusu objevit, a ty byly pote rozděleny do 6 kategorii – chyby lexikalni, gramaticke, syntakticke, ortograficke, lokalizacni a stylisticke. Chyby byly zanalyzovany v korpusu a nasledně porovnany s chybami vyskytujicimi se v korpusu BSC. K nejcastějsim chybam patřily chyby v kolokacich (chyby lexikalni), ve velkých pismenech a interpunkci (chyby ortograficke) a ve formatu cisel, dat a měn (chyby lokalizacni). Ukazalo se, že analyzovane chyby, ktere bylo možne porovnat, se ve studovanem korpusu vyskytovaly castěji než v korpusu BSC, nebo byla frekvence jejich výskytu stejna. Toto může být způsobeno tim, že korpus BSC obsahuje texty překladane univerzitnimi studenty anglickeho jazyka, kteři již maji jiste jazykove znalosti, a jejich překlady jsou tak na vyssi urovni. | Tato prace se zabýva běžnými chybami v překladech clanků na Wikipedii. Pro analýzu bylo využito paralelniho korpusu English/Czech [[Wikipedia]] Parallel Corpus. Na zakladě několika zdrojů byly identifikovany chyby, ktere by se potencialně mohly v korpusu objevit, a ty byly pote rozděleny do 6 kategorii – chyby lexikalni, gramaticke, syntakticke, ortograficke, lokalizacni a stylisticke. Chyby byly zanalyzovany v korpusu a nasledně porovnany s chybami vyskytujicimi se v korpusu BSC. K nejcastějsim chybam patřily chyby v kolokacich (chyby lexikalni), ve velkých pismenech a interpunkci (chyby ortograficke) a ve formatu cisel, dat a měn (chyby lokalizacni). Ukazalo se, že analyzovane chyby, ktere bylo možne porovnat, se ve studovanem korpusu vyskytovaly castěji než v korpusu BSC, nebo byla frekvence jejich výskytu stejna. Toto může být způsobeno tim, že korpus BSC obsahuje texty překladane univerzitnimi studenty anglickeho jazyka, kteři již maji jiste jazykove znalosti, a jejich překlady jsou tak na vyssi urovni. |
Revision as of 06:51, 28 August 2019
Authors | Adéla Štromajerová |
---|---|
Publication date | 2017 |
Links | Original |
Common Translation Errors in Wikipedia Articles: a Corpus-Based Study - scientific work related to Wikipedia quality published in 2017, written by Adéla Štromajerová.
Overview
Tato prace se zabýva běžnými chybami v překladech clanků na Wikipedii. Pro analýzu bylo využito paralelniho korpusu English/Czech Wikipedia Parallel Corpus. Na zakladě několika zdrojů byly identifikovany chyby, ktere by se potencialně mohly v korpusu objevit, a ty byly pote rozděleny do 6 kategorii – chyby lexikalni, gramaticke, syntakticke, ortograficke, lokalizacni a stylisticke. Chyby byly zanalyzovany v korpusu a nasledně porovnany s chybami vyskytujicimi se v korpusu BSC. K nejcastějsim chybam patřily chyby v kolokacich (chyby lexikalni), ve velkých pismenech a interpunkci (chyby ortograficke) a ve formatu cisel, dat a měn (chyby lokalizacni). Ukazalo se, že analyzovane chyby, ktere bylo možne porovnat, se ve studovanem korpusu vyskytovaly castěji než v korpusu BSC, nebo byla frekvence jejich výskytu stejna. Toto může být způsobeno tim, že korpus BSC obsahuje texty překladane univerzitnimi studenty anglickeho jazyka, kteři již maji jiste jazykove znalosti, a jejich překlady jsou tak na vyssi urovni.