← Back to team overview

sslug-teknik team mailing list archive

Re: Dansk ordbog i WORDPERFECT

 

Ole Tranberg wrote:

> Den ordog. Er det en der fungerer sammen med fx ispell? Fordi så er
> jeg i hvert fald meget interesseret, da den danske ordbog til ispell
> er temmelig ringe.

Du har tydeligvis brug for den :) OK, det var nemt, men sjovt - bemærk
smiley.

Nej, data er i mit eget format. Jeg arbejder på udvikling af en
tekstbehandler til handicappede med samplet tale. Data kan dog leveres i
form af en klartekstfil, eller evt. kan man jo lave en specialparser der
konverterer mine grundlister til et andet format med information om
ordets grammatiske status etc. Jeg har ikke konverteret det til Ispell,
da jeg ikke bruger Ispell selv - endnu.

Ordlisten er genereret som følger: Jeg har taget en dags danske
usenettrafik, samt mit oparbejdede Epostarkiv, brudt det om i ord,
filtreret mod en base af uønske de ord og strenge, sorteret dem på
frekvens og indsat dem i en liste, kategoriseret efter ordtype. De
fleste ord er reduceret til deres rod, og bøjninger genereres af et
seperat program. Jeg stoppede da jeg havde nået alle ord med en frekvens
på 100 eller derover. Dertil har jeg føjet en række ord, der var
passende for målgruppen. Jeg har desuden Navneinstituttets opgørelse
over tilladte drengenavne, tilladte pigenavne, og samtlige stednavne i
DK. Disse er så vidt jeg ved ikke behæftet med copyright, men det bør
checkes - jeg har dem bare for tilfældets skyld, da der er *mange*.

Ordvalget er altså med vægt på almindelig samtale og et liv som
handicappet. Men jeg har udviklet en række specialprogrammer, der gør
det ganske let (for mig - de er langt fra brugervenlige) at tilføje ord,
samt at sample ord i listen i WAV format.

Har nogen lyst til at gøre mig kunsten efter, tager det "blot" en måneds
tid at lave programmerne, og to måneder at indsamle ordene, kategorisere
dem og checke for stavefejl og fejlkategoriseringer.

Vil jeg frigive den? Det skal jeg lige tænke over... Den repræsenterer
mindst 3 måneders arbejde med henblik på at være en væsentlig del af et
kommercielt produkt, så selvom Stallmann vil rotere i sin grav, er det
ikke noget jeg lige havde tænkt over, og må altså sige at jeg kommer
tilbage til dig på det punkt.

Jeg vil dog gerne høre om mulighederne for at konvertere en sådan liste
til brugbare formater for Ispell og Wp8 - evt. andre programmer i samme
skuffe. Kan jeg sælge den for penge, og samtidigt bevare rettighederne
(en drøm måske, men mærkeligere ting er sket) kan alt jo ske.

Ja, jeg er et kapisvin - potientielt :) <- tror jeg.

And
-- 
Anders S. Johansen, Jagtvej 109, 3.tv, 2200 Kbh. N +045 35836565
Wisdom = TANJ + TANSTAAFL


Follow ups

References