Mitmekeelsete lehekülgedega töötamine
teisipäev, 22. juuni 2010
Mitmekeelseks leheküljeks loeme iga lehe, mis sisaldab sisu rohkem kui ühes keeles. Näiteks oleks selleks eesti äri, millel on eesti- ning venekeelsed versioonid, Lõuna-Ameerika jalgpalli teemaline blogi, mis on nii hispaania kui portugali keeles või erinevates keeltes turismisait. Kui teie sihitav publik koosneb erinevat keelt rääkivatest inimestest, siis tasub leht mitmekeelseks teha ning seda tehes tasub mõelda ka otsingumootorite peale.
Google ja keeletuvastus
Google üritab iga erineva lehe põhilisi keeli ära tunda. Te saate selle tuvastamise töö lihtsustamisel kaasa aidata, jättes ainult ühe keele ühe lehe kohta ning vältides külg-külje kõrval tõlkeid. Kuigi Google suudab ära tunda, et leht on rohkem kui ühes keeles, siis soovitame siiski kasutada sama keelt kõikides lehe osades – päistes, küljeribades, menüüdes jne.
Google ignoreerib kogu keeleinfot, mis on koodi tasemel nagu “lang” atribuudid või dokumendi tüübi definitsioonid (Document Type Definitions või DTD). Mõned veebihalduse programmid loovad need atribuudid automaatselt ning seega ei ole need väga usaldusväärsed keele tuvastamiseks.
Kui keegi teeb Google’is otsingut oma emakeeles, siis eeldab ta saada kohandatud otsingutulemusi ning siin tuleb sisse veebihalduri osa – kui te kavatsete lehe erinevates keeltes teha, siis tehke see allolevate nõuannetega ka otsingutulemustes nähtavaks.
Mitmekeelsete saitide anatoomia: URL-ide struktuur
Mitmekeelse saidi tegemisel pole eraldi URL-de loomine vajalik. Sellegipoolest võivad kasutajad tahta näha, mis osal teie saidist nad parasjagu on ja seda ainult URL-i vaadates. Näiteks allolevad URL-d näitavad, et ollakse inglisekeelsel osal:
http://example.ee/en/sightseeing.html
http://en.example.ee/sightseeing.html
Samas need URL-d annavad kasutajale teada, et loevad sama lehte eesti keeles.
http://example.ee/et/sightseeing.html
http://et.example.ee/sightseeing.html
Lisaks lihtsustab see URL-i struktuur teie lehe indekseerimise analüüsimisel.
Kui tahate kasutada URL-e mitte inglisekeelsete tähtedega, siis kasutage kindlasti UTF-8 kodeerimist. UTF-8 kodeeritud URL-d peaksid olema korralikult dekodeeritud kui neid lingitakse teie sisu seest. Kui te tahate oma URL-e käsitsi dekodeerida, siis leiate lihtsasti mõne URL kodeerija, mis teeb selle töö teie eest. Näiteks kui soovite tõlkida järgnevat URL-i eesti keelde:
http://example.ee/et/sightseeing.html,
siis näeks selle välja selline:
http://example.ee/et/vaatamisväärsusi.html.
Kuna URL-s on 2 mitte inglisekeelset tähte, siis korralikult dekodeeritud URL näeks teie lehel välja selline:
http://example.ee/et/vaatamisv%C3%A4%C3%A4%rsusi.html.
Sama leht venekeelsena oleks selline:
http://example.ee/ru/осмотр-достопримечательностей.html
või siis selline:
http://example.ee/ru/osmotr-dostoprimechatelnostei.html.
Mitmekeelse lehe indekseerimine
Soovitame hoiduda automaatselt tõlgitud lehtede indekseerimisest. Automaatsed tõlked ei ole alati korrektsed ja neid võidakse potentsiaalselt vaadata kui spämmi. Samuti tasub mõelda, kas lehe automaatsest tõlkimisest on üldse mingit kasu kui lehe külastajad sellest aru ei saa.
Kui te tõlgite oma sisu ära, siis tehke Google’i robotile (Googlebotile) kõikide versioonide läbiroomamine võimalikult lihtsaks. Võimalusel lisage igale lehele link selle konkreetse lehe muukeelsele versioonile. Näiteks kui inglise keelt kõnelev kasutaja jõuab lehele http://example.ee/et/vaatamisväärsusi.html; siis võiks ta ühe klikiga jõuda lehele http://example.ee/en/sightseeing.html, kus ta näeb sama sisu inglisekeelsena.
Selleks, et teha kogu leht paremini roomatavaks vältige automaatseid ümbersuunamisi kasutaja eeldatavale keelele. Sellised ümbersuunamised võivad takistada kasutajaid (ja otsingumootoreid) kõikide teie lehe erinevate versioonidega tutvumast.
Viimase soovitusena hoidke erineva keelega seotud sisu erinevatel URL-del – ärge kasutage küpsiseid tõlgitud versioonide näitamiseks.
Tähtede kodeerimine
Google võtab tähtede kodeeringud HTTP päisest, HTTP lehe päistest ja sisust. Selles osas pole teil väga palju vaja teha, peale selle, et jälgida seda, et vastuolus informatsiooni poleks - näiteks sisu ja päiste vahel. Kuigi Google suudab aru saada erinevatest kodeeringutest, soovitame me siiski kasutada UTF-8 kodeeringut kui see vähegi võimalik on.
Lõpetuseks…
Lisainfot leiate meie postitusest erinevaid piirkondi sihtivate lehtede kohta. Hoidke blogil silma peal, sest varsti kirjutame SEO teemadel veelgi. Seniks ärge kartke meie abifoorumis just sellel teemal käivas arutelus sõna võtta!
Google ja keeletuvastus
Google üritab iga erineva lehe põhilisi keeli ära tunda. Te saate selle tuvastamise töö lihtsustamisel kaasa aidata, jättes ainult ühe keele ühe lehe kohta ning vältides külg-külje kõrval tõlkeid. Kuigi Google suudab ära tunda, et leht on rohkem kui ühes keeles, siis soovitame siiski kasutada sama keelt kõikides lehe osades – päistes, küljeribades, menüüdes jne.
Google ignoreerib kogu keeleinfot, mis on koodi tasemel nagu “lang” atribuudid või dokumendi tüübi definitsioonid (Document Type Definitions või DTD). Mõned veebihalduse programmid loovad need atribuudid automaatselt ning seega ei ole need väga usaldusväärsed keele tuvastamiseks.
Kui keegi teeb Google’is otsingut oma emakeeles, siis eeldab ta saada kohandatud otsingutulemusi ning siin tuleb sisse veebihalduri osa – kui te kavatsete lehe erinevates keeltes teha, siis tehke see allolevate nõuannetega ka otsingutulemustes nähtavaks.
Mitmekeelsete saitide anatoomia: URL-ide struktuur
Mitmekeelse saidi tegemisel pole eraldi URL-de loomine vajalik. Sellegipoolest võivad kasutajad tahta näha, mis osal teie saidist nad parasjagu on ja seda ainult URL-i vaadates. Näiteks allolevad URL-d näitavad, et ollakse inglisekeelsel osal:
http://example.ee/en/sightseeing.html
http://en.example.ee/sightseeing.html
Samas need URL-d annavad kasutajale teada, et loevad sama lehte eesti keeles.
http://example.ee/et/sightseeing.html
http://et.example.ee/sightseeing.html
Lisaks lihtsustab see URL-i struktuur teie lehe indekseerimise analüüsimisel.
Kui tahate kasutada URL-e mitte inglisekeelsete tähtedega, siis kasutage kindlasti UTF-8 kodeerimist. UTF-8 kodeeritud URL-d peaksid olema korralikult dekodeeritud kui neid lingitakse teie sisu seest. Kui te tahate oma URL-e käsitsi dekodeerida, siis leiate lihtsasti mõne URL kodeerija, mis teeb selle töö teie eest. Näiteks kui soovite tõlkida järgnevat URL-i eesti keelde:
http://example.ee/et/sightseeing.html,
siis näeks selle välja selline:
http://example.ee/et/vaatamisväärsusi.html.
Kuna URL-s on 2 mitte inglisekeelset tähte, siis korralikult dekodeeritud URL näeks teie lehel välja selline:
http://example.ee/et/vaatamisv%C3%A4%C3%A4%rsusi.html.
Sama leht venekeelsena oleks selline:
http://example.ee/ru/осмотр-достопримечательностей.html
või siis selline:
http://example.ee/ru/osmotr-dostoprimechatelnostei.html.
Mitmekeelse lehe indekseerimine
Soovitame hoiduda automaatselt tõlgitud lehtede indekseerimisest. Automaatsed tõlked ei ole alati korrektsed ja neid võidakse potentsiaalselt vaadata kui spämmi. Samuti tasub mõelda, kas lehe automaatsest tõlkimisest on üldse mingit kasu kui lehe külastajad sellest aru ei saa.
Kui te tõlgite oma sisu ära, siis tehke Google’i robotile (Googlebotile) kõikide versioonide läbiroomamine võimalikult lihtsaks. Võimalusel lisage igale lehele link selle konkreetse lehe muukeelsele versioonile. Näiteks kui inglise keelt kõnelev kasutaja jõuab lehele http://example.ee/et/vaatamisväärsusi.html; siis võiks ta ühe klikiga jõuda lehele http://example.ee/en/sightseeing.html, kus ta näeb sama sisu inglisekeelsena.
Selleks, et teha kogu leht paremini roomatavaks vältige automaatseid ümbersuunamisi kasutaja eeldatavale keelele. Sellised ümbersuunamised võivad takistada kasutajaid (ja otsingumootoreid) kõikide teie lehe erinevate versioonidega tutvumast.
Viimase soovitusena hoidke erineva keelega seotud sisu erinevatel URL-del – ärge kasutage küpsiseid tõlgitud versioonide näitamiseks.
Tähtede kodeerimine
Google võtab tähtede kodeeringud HTTP päisest, HTTP lehe päistest ja sisust. Selles osas pole teil väga palju vaja teha, peale selle, et jälgida seda, et vastuolus informatsiooni poleks - näiteks sisu ja päiste vahel. Kuigi Google suudab aru saada erinevatest kodeeringutest, soovitame me siiski kasutada UTF-8 kodeeringut kui see vähegi võimalik on.
Lõpetuseks…
Lisainfot leiate meie postitusest erinevaid piirkondi sihtivate lehtede kohta. Hoidke blogil silma peal, sest varsti kirjutame SEO teemadel veelgi. Seniks ärge kartke meie abifoorumis just sellel teemal käivas arutelus sõna võtta!
Kommentaare ei ole :
Postita kommentaar