Der Blick in die Literartur hilft zumindest ein bischen weiter:
- http://lql.uni-trier.de/index.php/Syllable_length
- http://de.wikipedia.org/wiki/Gesetz_der_Verteilung_von_Silbenlängen
Natürlich fallen die Statistiken für verschiedene Sprachen etwas unterschiedlich aus. Aber es gibt Gemeinsamkeiten. Offenbar sind in den europäischen Sprachen die meisten Silben 2 oder 3 Laute lang. Silben mit 1, 4 oder 5 Lauten kommen auch vor, sind aber selten. Ein Laut kann mehrere Buchstaben umfassen. Beispiele dafür aus dem Deutschen sind "au", "ng" oder "sch".
Für einen ersten Algorithmus erscheint es mir legitim bei 8 Buchstaben ein Abbruchkriterium einzubauen und später nachzuprüfen ob das reicht.