[ maddog_srb @ 01.04.2013. 18:15 ] @
Treba mi spisak svih(sto vise to bolje) reci srpskog jezika u nekom citljivom formatu, po mogucstvu obican text fajl... Zna li neko gde mogu to da nadjem...

Pokusavao sam sa nekim recnicima, ali nisam nasao neki cija je baza u citljivom formatu, ako neko ima neki koji je citljiv neka mi kaze ime, pa cu ga skinuti.
[ superbaka @ 01.04.2013. 22:27 ] @
nisam bas siguran da takva baza predstavlja javno dobro... obicno ima autorsko pravo onog ko ga je sakupio...
[ HeYoo @ 01.04.2013. 22:39 ] @
Pravis slagalicu?
Mozes napraviti svoju bazu tako sto ces reci skupljati pomocu skripte sa nekog novinskog sajta koji bar malo drzi do pravopisa.
Na primer izvrtis sve clanke sa Politike koji su napisani u par godina, proveravas rec po rec da li je unkat, a duplikate, interpukcije i ostalo djubre odbacujes. Na kraju bi trebao da imas sasvim pristojnu bazu koju eventualno treba rucno ocistiti.
[ ZaMpA @ 01.04.2013. 22:41 ] @
Brut-forsuješ passworde? c,c,c...
[ maddog_srb @ 01.04.2013. 22:59 ] @
Nije brute-force, napravio sam neki jquery plugin za prebacivanje web stranica iz latinice u cirilicu, pa mi treba spisak reci koje imaju u sebi slova dj, nj, lj otprilike :)
Pa sam mislio da uzmem neki recnik i da pretrazim takve reci, a ovo sa skupljanjem reci sa recimo politike nije losa ideja, ujedno mogu da filtriram odmah reci koje imaju ove dvoznake...

Ako neko u medjuvremenu ima neki recnik sa citljivom bazom, neka javi da se ne mucim ;)
[ pajaja @ 01.04.2013. 23:03 ] @
open office je imao bazu reci za download ali ne mogu da se setim gde je link, ako jos uvek postoji za download.
[ maddog_srb @ 02.04.2013. 08:24 ] @
Nasao sam na https://github.com/grakic/dict-sr-oxt

Dosao sam do njega preko libreoffice-a, hvala pajaja.