database - ¿Cómo obtener una base de datos de palabras en inglés?
words (6)
No dijiste para qué necesitabas esta lista. Si algo usado como una lista negra para verificar contraseñas es suficiente, cracklib podría ser bueno para usted. Contiene más de 1,5 millones de palabras.
Necesito una base de datos de cada palabra válida en inglés. /usr/share/dict/words
archivo /usr/share/dict/words
, contiene menos de 100k palabras. Wikipedia dice que el inglés tiene 475k de palabras. ¿Dónde obtengo la lista completa (ortografía estadounidense)?
Además, ¿hay un único sitio web que también da palabras para otros idiomas, incluidos los asiáticos y europeos?
Editar: Olvidé agregar, no necesito nombres, etc., palabras válidas en inglés.
No existe una lista "completa". Diferentes personas tienen diferentes formas de medir, por ejemplo, pueden incluir jerga, neologismos, frases de varias palabras, términos ofensivos, palabras extranjeras, conjugaciones de verbos, etc. ¡Algunas personas incluso han contado un millón de palabras ! Por lo tanto, tendrá que decidir lo que quiere en una lista de palabras.
No veo http://wordlist.sourceforge.net/ mencionado aquí, pero ahí es donde comenzaría si estuviera buscando algo como esto (y lo estaba, cuando tropecé con esta pregunta).
Si no puede encontrar lo que quiere allí, y lo que desea es una lista de palabras en inglés, entonces probablemente deba dedicar más tiempo a describir cómo reconocer qué es lo que quiere.
Puede consultar el diccionario *spell
en-GB utilizado por Mozilla, OpenOffice, muchos otros programas.
Puede encontrar lo que necesita en infochimps.org .
Tienen una lista de 350,000 palabras simples (es decir, no compuestas) disponibles para su descarga gratuita.
Lista de palabras: más de 350,000 palabras en inglés simples
Con respecto a otros idiomas, es posible que desee hurgar en Wiktionary. Aquí hay un enlace a todas las copias de seguridad de la base de datos : la información no está organizada, pero si tienen un idioma, puede descargar los datos en formato SQL.
WordNet base de datos de WordNet puede ser útil. Una vez trabajé en un complemento de Firefox que trata con palabras y todo tipo de asociaciones simples o complicadas entre ellos y esas cosas. Parece que WordNet te será muy útil.
Aquí está en formato MySQL . Y este (enlace archivado en la web) usa datos de Wordnet v3.0, en lugar de los datos anteriores de Wordnet 2.0.