31 oktober 2010

Woordherkenning, - correctie en -aanvulling

Eén van de triviale functies die in (althans mijn) tekstverwerkers ontbreken is een zelflerende, automatische woordherkenner, woordcorrector en woordaanvuller.
Hoe makkelijk zou het niet zijn als ik, net als ik nu wel op mijn mobiel heb bij het invoeren van een sms, ook bij het typen van tekst op een pc zo'n functie zou hebben.Het enige wat Word tot nu toe (Office 2007) levert is een rood ribbellijntje dat het woord niet wordt herkend. En een enkele keer wordt dit automatisch naar een wèl bestaand woord getransformeerd, maar meestal moet ik het zelf corrigeren of naar de dichtstbijzijnde suggestie vragen. Als Word die suggestie al heeft, waarom dan niet daardoor vervangen?

Ik zou willen dat Word een database meekrijgt waarin alle (paar duizend) meest gebruikelijke woorden staan met daarin de frequentie van voorkomen. Vervolgens worden al mijn documenten gescand en worden de door mij gebruikte woorden geïnventariseerd, ook met de frequentie van vóórkomen.
Als ik dan in een nieuwe tekst een woord begin, dan komt de tekstverwerker direct met het meest gebruikte woord als suggestie. Zo lang dat niet het woord is dat ik wil, typ ik door, tot het gesuggereerde woord er staat dat ik bedoel, dan druk ik op 'Enter'. Klaar is kees.
Wordt het woord helemaal niet herkend, dan komt ie, na de spatie of het leesteken dat ik vervolgens invoer, met het rode ribbellijntje zodat ik het woord kan toevoegen. Of met een gesuggereerd woord (bijvoorbeeld met een groen ribbellijntje) als er vermoed kan worden dat ik iets anders bedoelde dan ik typte, omdat het gesuggereerde woord wel héél dicht in de buurt  komt.
Zo'n nieuw woord wordt dan weer aan de database toegevoegd en kan dan een volgende keer weer een rol spelen.

(Waarschijnlijk is dat onbekend, maar de afstand tussen twee woorden kan gemeten worden door het aantal letters dat je moet invoegen, weglaten of omwisselen, de zogenaamde "Levenshtein distance")

Is dat nou zo moeilijk?

Geen opmerkingen:

Een reactie posten