database words

database - ¿Cómo obtener una base de datos de palabras en inglés?



words (6)

No dijiste para qué necesitabas esta lista. Si algo usado como una lista negra para verificar contraseñas es suficiente, cracklib podría ser bueno para usted. Contiene más de 1,5 millones de palabras.

Necesito una base de datos de cada palabra válida en inglés. /usr/share/dict/words archivo /usr/share/dict/words , contiene menos de 100k palabras. Wikipedia dice que el inglés tiene 475k de palabras. ¿Dónde obtengo la lista completa (ortografía estadounidense)?

Además, ¿hay un único sitio web que también da palabras para otros idiomas, incluidos los asiáticos y europeos?

Editar: Olvidé agregar, no necesito nombres, etc., palabras válidas en inglés.


No existe una lista "completa". Diferentes personas tienen diferentes formas de medir, por ejemplo, pueden incluir jerga, neologismos, frases de varias palabras, términos ofensivos, palabras extranjeras, conjugaciones de verbos, etc. ¡Algunas personas incluso han contado un millón de palabras ! Por lo tanto, tendrá que decidir lo que quiere en una lista de palabras.


No veo http://wordlist.sourceforge.net/ mencionado aquí, pero ahí es donde comenzaría si estuviera buscando algo como esto (y lo estaba, cuando tropecé con esta pregunta).

Si no puede encontrar lo que quiere allí, y lo que desea es una lista de palabras en inglés, entonces probablemente deba dedicar más tiempo a describir cómo reconocer qué es lo que quiere.


Puede consultar el diccionario *spell en-GB utilizado por Mozilla, OpenOffice, muchos otros programas.



WordNet base de datos de WordNet puede ser útil. Una vez trabajé en un complemento de Firefox que trata con palabras y todo tipo de asociaciones simples o complicadas entre ellos y esas cosas. Parece que WordNet te será muy útil.

Aquí está en formato MySQL . Y este (enlace archivado en la web) usa datos de Wordnet v3.0, en lugar de los datos anteriores de Wordnet 2.0.