Another way to understand my speech in
So far, GramTrans been the only freely available maskinoversættelsesservice online.
But now Google Translate been extended by the Danish, and it seems that Danish freely combined with all their other languages.
This post is written in English and translated into English by Google Translate.
[Weird! The last sentence in the Danish original began: “Dette indlæg er skrevet på dansk…”]
Det begynder da først at blive sjovt, når google får lov at oversætte tilbage igen:
Se her, hvad der så sker:
Hidtil har GramTrans været den eneste frit tilgængelige maskinoversættelsesservice online.
Men nu er Google Translate blevet forlænget fra den danske, og det lader til, at dansk frit kombineres med alle deres andre sprog.
Dette indlæg er skrevet på engelsk og oversat til engelsk af Google Translate.
[Underlig! Det sidste punktum i dansk oprindelige begyndte: “Dette indlæg er skrevet in English …”]
Men måske man skulle bruge knappen “Forslå bedre oversættelse”?
Ja de statistiske metoder er rigtig gode. Det er ikke underligt, at den oversætter “Dansk” til “English” for når der står ‘dansk’ på dansk står der ‘English’ på engelsk. Jeg har arbejdet med det på undertekster og der “oversatte” den i begyndelsen navne lidt mærkeligt, fordi vi ikke havde filtreret oversætternes navne fra i træningsdataene.
(Apropos: hvis der er et firma derude, der har brug for SMT, er jeg ledig efter sommerferien :-))
Jeg véd ikke meget om SMT – kan du anbefale en god bog eller et par gode artikler? Umiddelbart lyder det vanskeligt at finde statistiske eksempler på alt, man vil oversætte – ofte er der vel et adjektiv for meget eller for lidt, eller tempus er forkert, eller sådan noget. Hvad er løsningen?
Grundlaget for statistisk MT er ikke “sandsynligheden” af oversættelser af sætninger men af ord. Man klipper sætningen i de “mest sandsynlige” fraser, giver den “mest sandsynlige” oversættelse af hver, og sætter dem i den “mest sandsynlige” rækkefølge.
Den bedste bog er Philip Koehns, men den er ikke udkommet endnu 😉
Der er en skide-god, meget let-læst, artikel, vistnok af Philip Koehn, men jeg kan ikke huske hvor den er.
I stedet vil jeg anbefale http://www.statmt.org/moses/?n=Moses.Background
og Kevin Knights ‘SMT Handbook’ (den er også på http://www.statmt.org/).
Hvis man vil undgå hovedpine, skal man læse hurtigt henover matematikken (men så er der ikke så meget tilbage).
Nu forstår jeg. Tak!