Internationalisering, lokalisering, kodning, Island og oversættelse af et japansk katfoto-websted
Der er en masse information derude, når det kommer til internationalisering, lokalisering og kodning inden for webapplikationer. Der er også en masse misforståelser om, hvad hver giver til en webapplikation. Her er min opfattelse ...
Når en webbrowser opretter forbindelse til en webserver, videregiver den en hel del variabler og fremsætter yderligere anmodninger, her er et eksempel:
GET / HTTP / 1.1
Vært: www.dknewmedia.com
Brugeragent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Accepter: HTTP Accept = tekst / xml, applikation / xml, applikation / xhtml + xml, tekst / html; q = 0.9, tekst / almindelig; q = 0.8, billede / png, * / *; q = 0.5
Accept-sprog: en-us, en; q = 0.5
Accept-kodning: gzip, deflater
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Internationalisering
Internationalisering er en sammensætning af mange ting:
- Lokalisering: Evnen til at identificere hvilket sprog og placering en besøgende besøger fra. Dette gøres via HTTP-anmodninger, hvor den besøgende identificeres af en lokal. I mit tilfælde er det en-US. "Da" er engelsk og "USA" er USA. Dette er en indstilling i mit operativsystem.
- Tidszoner: Evnen til at justere for tidszoner. Dette opnås normalt ved at indstille din server til en Greenwich Mean Time (GMT) og derefter give brugerne mulighed for at indstille deres lokale forskydning fra GMT.
- Tegnkodning: Dette er evnen til at vise sprogtegnsæt korrekt. Det er forskelligt fra lokalisering, da lokalisering kan fortælle mig sproget og regionen på den computer, der fremsætter anmodningen fra, men det fortæller mig ikke, hvilket sprog læser beder ... det er op til læseren!
Bemærk i min HTTP-header, når browseren fremsatte anmodningen, fortalte den serveren, at den anmodede om min lokalitet (Accept-Language: en-us); dog skal den også fortælle serveren, hvilket tegnsæt der anmodes om (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 og utf -8 er begge tilladte tegnsæt.
Lokalisering
I denne fantastiske blandede verden dikterer lokalisering aldrig sprog mere. Selvom jeg er i en-US, kan jeg absolut læse et andet sprog ved hjælp af et andet tegnsæt ... det er hvad der sker, når jeg bruger Google hindi (Jeg bruger ikke rigtig Google Hindi). Min anmodning om sprog og tegnsæt er identisk, som når jeg anmoder om Google engelsk side, men jeg får faktisk en side, som jeg ikke kan læse, fordi jeg ikke har tegnsættet. Det hele kommer op ???????????… Men jeg kan indlæse det tegnsæt i Firefox (Firefox> Indstillinger> Avanceret> Sprog):
Hvis jeg indlæser dette sprog, kan jeg derefter anmode om siden i dets oprindelige tegnsæt og vise den på min computer, selvom min standardsprog er en-US!
Så ... hvis jeg er hindi-studerende, studerer jeg engelsk i Purdue og har forbindelse via VPN til skolens server, på ferie i Australien ... der er 3 forskellige indstillinger, der skal anvendes på applikationen for virkelig at blive internationaliseret - og ingen afhænger af den anden.
Min lokalitet ville komme op som en-US, men min tidszone er Australien, men det sprog, jeg anmoder om fra webstedet, kan være hindi. Hvis jeg skulle programmere min ansøgning til at lave antagelser baseret på min computers lokalitet, ville jeg være helt forkert - fodre personen engelsk i en østlig tidszone. Ideelt set vil jeg programmere min ansøgning til at tilbyde både sprog- og tidszoneindstillinger ... men jeg antager ikke dem baseret på landestandard.
Island - det ultimative eksempel
Vi er uvidende om flersprogede og multilokale udfordringer i USA, hvor vi alle taler engelsk [underforstået sarkasme]. I nogle lande, såsom Island, selvom modersmålet er islandsk, vokser det utrolige islandske folk op med at lære 3 sprog! Da Island er et land midt i Europa og Nordamerika, arbejder deres virksomheder overalt på flere kontinenter, sprog, sprogdialekter og flere tidszoner fra deres skrivebord!
Mange islandske hjemmesider er bygget på amerikansk engelsk, britisk engelsk, islandsk, spansk, spansk, fransk og tysk! Forestil dig hvor udfordrende det ville være at bygge Icelandair's webstedsapplikationer og billetsystemer ... wow!
ANSVARSFRASKRIVELSE: Jeg har haft den absolutte glæde at arbejde med de fine folk fra Icelandair og kan fortælle dig, at de er nogle af de mest talentfulde og venlige fagfolk, jeg har haft fornøjelsen at arbejde med. Det er simpelthen et fantastisk land og folk! Gå på besøg ... tag Icelandair og sørg for at besøge Blue Lagoon!
Sprog versus kodning
Der er endda forskellige karakterkodninger inden for et enkelt sprog, der ikke spiller godt sammen! Eksempel: En japansk e-mail skrevet i Shift-JIS kan muligvis blive ulæselig på en japansk persons computer med lokalisering indstillet til ja-JP, fordi deres mailserver kun genkender EUC-JP. Ideelt set skal en kunde være i stand til at indstille, hvilken kodning de ønsker, samt hvilket sprog - blot sikre, at kodningen og sproget er kompatibelt med det, klienten anmoder om.
Hvis jeg ønsker at læse japansk, skal jeg muligvis vælge både japansk som mit sprog OG Shift-JIS til kodning for at få vist dette sprog korrekt. Her er lidt mere forvirring at tilføje til blandingen ... nogle kodningstyper understøtter flere sprog. UNICODE / UTF8 understøtter dusinvis. Det modsatte gælder også. Nogle sprog kan læses i mange kodningstyper. Hvis det ikke giver mening ... Jeg undskylder, det er et meget komplekst spørgsmål.
En dag tror jeg (håber) det hele vil ændre sig. Jeg tror, at de oprindelige designere af lokaliseringskoder håbede, at sprogkombinationen var alt, hvad der var nødvendigt ... men vi er blevet langt mere sofistikerede. Husk, meget af dette blev udviklet, før der eksisterede et internet. Med fremkomsten af GIS, måske en person kan vælge deres kodning, og GIS håndterer tidszone og lokal information.
Internationalisering
Tilbage til internationaliseringsstøtte. Hvis du vil levere en internationaliseret applikation, skal du:
- Understøtter flere kodningstyper, sprog og har oversættelsesfiler til at vise disse oversættelser.
- Tillad klienten at indstille deres sprog, og endda måske deres kodningstype, hvis det er nødvendigt.
- Understøtt tidszoner ved at lade brugerne henvise til deres tidszone sammenlignet med GMT.
- Brug lokaliseringskoder med forsigtighed ... de viser IKKE nøjagtigt, hvad din bruger faktisk beder om, eller hvad de kan læse.
Oversættelse
Maskinoversættelse er stadig i sin barndom. Der er en række hjemmesider derude (og WordPress plugins), der tilbyder maskinoversættelse af dit websted. Lad dig ikke friste til at gøre dette ... der er to grunde til:
- Hvis maskinoversættelse fungerer, har den bruger, der tjekker dit websted, allerede en oversætter til at arbejde med.
- Maskinoversættelse stinker.
Tro mig ikke? Her er en japansk oversættelse til dig:
Indsat fra Masatsu-fil - en fyr med masser af billeder af katte:
Japansk blogindlæg
??
- 00:29:35 af masatsu??????????????????????????
???????????????????????????????????? (?)?
?????????????????????????????????????
??????????????????????????????????????????????????????????????? (?)
?????????????????
??????????????
??
?????????????????????????????????????????
???????????????????????????????
????????????????????????????????????????
????????????????????????????????????
?????????? Ag ?????????????????????????????????????????????????????
Maskinoversættelse:
?? Hann ?????
-00: 29: 35 af masatsuNavnet på nævehelgen på en / elefanten, der dukkede op på gårsdagens “a / the beast fist flåde ?? ranger ”“ ?? Hann ???? ” med en / radioskuespilleren Yutaka Mizushima….
? (?) der gør blæksprutte let.
Fordi selv radioskuespilleren fra knytnævehelgen, mester ????? af en / katten er den kinesiske kvede af en Nagai Ichiro = drakugle staven af en / den ?? ranger ligner de mennesker, der vittige bemærkninger kender let.
???
?????? Hvis jeg skriver for sent i år,
??????? helligdom ??? (kan hvordan?)? forager cullion (?? skåret ikke) Fukami ?? (? eller observer i stand til?) er det det, der gør
?????? Med, bliver det "en dåse /? /?", Med andre ord "kung fu", når du stiller op og skifter hovedet til et navn.
?????? Selvom det siges at øge yderligere to angiveligt, kan det blive hvilken slags navn.
Sandheden siges at være "alder", fordi symbolet på sølvelementet er Ag?, Selvom navnet på "???? sølv ”Takaoka? tekniker af ??????? tænkte at karakteren kaldes “?” blev brugt sammen med en silver'screen? film, hvis den kalder det med et tilføjelsesmedlem.
?????? Men jeg tænker egoistisk, at min teori ikke er uafhængig af, at “?” er inkluderet i en / den kinesiske karakter.
Jeg er sikker på, at omvendt polaritet på denne oversættelse ville give en lige så læsbar ordbog på engelsk. Du forstod indgangen, ikke?