← Takaisin etusivulle

Voikko
ohjelmistojen suomennosten oikoluku

Vapaiden ohjelmistojen käyttöliittymien suomentaminen tapahtuu tavallisesti niin sanottuja po-tiedostoja muokkaamalla. Tällä sivulla kerrotaan, kuinka näitä tiedostoja voi tehokkaasti oikolukea Voikon avulla. Sivulta löytyy myös vinkkejä www-pohjaisten käännöstyökalujen (Pootle yms.) käyttäjille. Sivu on siis tarkoitettu ohjelmistojen suomentajien opastukseksi.

Käytettävissä olevat työkalut

Po-tiedostojen oikoluku www-liittymän kautta

Valmiin po-tiedoston voi oikolukea ilman omalle koneelle asennettavia lisäohjelmia käyttämällä Webvoikon po-oikolukutoimintoa. Webvoikon käyttämä sanasto on muunneltu versio Voikon perussanastosta: siihen on lisätty atk-sanastoa, matemaattis-luonnontieteellistä sanastoa ja joitakin erityisesti po-tiedostoissa vastaan tulevia merkkijonoja, joita oikoluvussa käytetty pofilter-ohjelmisto ei vielä osaa käsitellä.

Po-tiedostojen oikoluku pofilter-ohjelmalla

Jos Webvoikko ei vastaa tarpeitasi tai muuten haluat suorittaa oikoluvun kokonaan omalla koneellasi, voit käyttää translate-toolkit-ohjelmapaketin mukana tulevaa pofilter-ohjelmaa. Sen avulla po-tiedostoista voi etsiä muitakin ongelmia kuin kirjoitusvirheitä, joten ohjelmaan tutustuminen on paljon käännöstyötä tekeville erittäin suositeltavaa. Myös Webvoikko käyttää tätä ohjelmaa, joten lopputuloksen kannalta ei ole juurikaan merkitystä, kumpaa oikolukuun käyttää. Pofilter käyttää oikoluvussa Enchant-kirjastoa.

Tarvittavat ohjelmat ovat mukana ainakin Debianissa (testing/lenny ja unstable) ja Ubuntussa (7.10 ja uudemmat). Näissä on asennettava ohjelmapaketit translate-toolkit, libenchant-voikko ja python-enchant.

Jos suomenkieliset käännökset sijaitsevat tiedostossa kaannos.po, seuraava komento tuottaa listan mahdollisista kirjoitusvirheistä tiedostoon errors.po:

pofilter --gnome --lang=fi -tspellcheck -ikaannos.po -oerrors.po

Parametri --gnome (tai --kde, --openoffice tai --mozilla) näyttää olevan tarpeellinen oikoluvun toiminnan kannalta. Tämä saattaa olla bugi pofilterissä.

Oikoluku po-editorissa

Po-tiedostoja voi oikolukea jo muokkauksen aikana, jos käyttää po-editoria, jossa on oikolukutoiminto. KBabel on eräs tällainen ohjelma. Valitettavasti sen oikolukutoiminnossa näyttää olevan bugeja, sillä oikoluku saattaa yksinkertaisesti lakata toimimasta jossain vaiheessa ohjelman käytön aikana. Syytä tähän ei tiedetä.

Oikoluku www-selaimessa

Viime aikoina www-pohjaisten käännösohjelmistojen suosio on ollut kasvussa. Pootle on suosittu www-pohjainen po-editori, ja Debianin ohjelmapakettien kuvausten kääntämisessä on myös otettu käyttöön www-pohjainen liittymä. Näitä kannattaa käyttää selainohjelmalla, jossa on käytettävissä tekstikenttien oikolukutoiminto. Firefoxiin oikoluvun saa Voikko-lisäosan avulla, ja Konquerorissa oikoluku toimii, jos tmispell-voikko on asennettu ja KDE:n oikolukuasetukset ovat kunnossa. Oikoluku on erittäin hyödyllinen toiminto myös wikisivuja muokattaessa.

Sopiva oikolukusanasto

Ohjelmien oikoluku onnistuu toki Voikon perussanastonkin avulla. Siitä kuitenkin puuttuu paljon tietotekniikan erikoissanastoa, jota ohjelmien käyttöliittymissä esiintyy. Siksi oikoluku onnistuu tehokkaammin ja mukavammin, kun käytössä on sopivasti laajennettu sanasto. Merkittävä parannus perussanastoon saadaan, kun siihen lisätään atk-erikoissanasto sekä atk-lyhenteet. Myös matemaattis-luonnontieteellisen alan sanaston lisäämisestä on usein hyötyä, ainakin jos suomennettavana on taulukkolaskenta- tai kuvankäsittelyohjelmia.

Webvoikossa tällainen sanasto on jo käytössä, mutta omalla koneella oikolukua tekevien on koottava se itse. Tämän voi tehdä Suomi-malagan kehitysversiosta asentamalla ohjelmapaketit git ja malaga-bin ja antamalla seuraavat komennot:

mkdir -p ~/po-oikoluku
cd ~/po-oikoluku
git clone https://github.com/voikko/corevoikko
cd corevoikko/voikko-fi
make voikko-install DESTDIR=. GENLEX_OPTS="--extra-usage=it,science" \
 EXTRA_LEX="vocabulary/erikoisalat/atk-lyhenteet.lex vocabulary/erikoisalat/po-oikoluku.lex"

Erikoissanaston saa käyttöön asettamalla ympäristömuuttujan VOIKKO_DICTIONARY_PATH arvoksi polun voikko-fi-hakemistoon. Jos esimerkiksi käyttää Pootlea Konquerorin kautta, voi Konquerorin käynnistää komennolla

VOIKKO_DICTIONARY_PATH=~/po-oikoluku/corevoikko/voikko-fi konqueror

Huom: Erikoissanaston käyttöönotto yllä kuvatulla tavalla ei toimi Firefoxissa, jos siihen on asennettu oikolukulisäosa Mozillan lisäosapalvelimelta. Ainoastaan Linux-jakeluita varten paketoidut lisäosat mahdollistavat vaihtoehtoisten sanastojen käytön tällä tavalla. Mozillan palvelimilta saatavan Voikko-lisäosan saa käyttämään omaa tai käyttöjärjestelmän mukana tullutta sanastoa poistamalla lisäosan asennushakemistosta tiedoston voikko-fi_FI.pro.

(TODO: Miten lisään sanastoon oman projektini nimistöä?)

Kannattaa huomata, että varsinaisten kirjoitusvirheiden lisäksi Voikko havaitsee myös joitakin yhdyssanoihin liittyviä kielivirheitä. Se ei esimerkiksi hyväksy sanaa "olemassaoleva" vaan ehdottaa sen jakamista sanoiksi "olemassa oleva". Tämä onkin suositeltavampi muoto. Tällaiset korjaukset kannattaa silti käydä läpi tavallista huolellisemmin, sillä joskus ne vaativat laajempia korjauksia alkuperäiseen käännökseen. Joissakin tapauksissa voi myös olla, että käytetty yhdyssana on sopivaa kirjoittaa yhteen. Mikäli katsot, että Voikko virheellisesti hylkää jonkin sanan, voit ehdottaa sen lisäämistä sanastoon sanastonkeruulomakkeen avulla.