type inputs html html5 lang

inputs - ¿Cuál es la diferencia entre<html lang="en"> y<html lang="en-US">?



type of inputs html (6)

<html lang="en">
<html lang="en-US">

La primera etiqueta lang solo especifica un código de idioma. El segundo especifica un código de idioma, seguido de un código de país.

¿Qué otros valores pueden seguir al tablero? De acuerdo con w3.org "Se entiende que cualquier subcódigo de dos letras es un código de país [ISO3166]". Entonces, ¿eso significa que cualquier valor enumerado bajo el código alfa-2 es un valor aceptado?

Sí, sin embargo, el valor puede o no tener un significado real.

<html lang="en-US"> básicamente significa "esta página está en el estilo de inglés de Estados Unidos". De manera similar, <html lang="en-GB"> significaría "esta página está en el estilo de inglés del Reino Unido".

Si realmente deseaba especificar una combinación inválida, podría hacerlo. No significaría mucho, pero <html lang="en-ES"> es válido de acuerdo con la especificación, tal como lo entiendo. Sin embargo, esa combinación de idioma / país no hará mucho, ya que el inglés no se habla comúnmente en España.

Quiero decir, ¿esto de alguna manera ayuda al navegador a mostrar la página?

No ayuda al navegador mostrar la página, pero es útil para los motores de búsqueda, lectores de pantalla y otras cosas que pueden leer e interpretar la página, además de los seres humanos.

¿Cuál es la diferencia entre <html lang="en"> y <html lang="en-US"> ? ¿Qué otros valores pueden seguir al tablero?

De acuerdo con w3.org "Se entiende que cualquier subcódigo de dos letras es un código de país [ISO3166]". Entonces, ¿eso significa que cualquier valor enumerado bajo el código alfa-2 es un valor aceptado?


Bueno, la primera pregunta es fácil. Hay muchos en inglés (inglés) pero (principalmente) solo un inglés estadounidense. Uno podría adivinar que hay en-CN , en-GB , en-AU . Supongo que incluso podría haber un inglés austriaco, pero eso es más sí que sí que sí.


Esto debería ayudar: http://www.w3.org/International/articles/language-tags/

La regla de oro al crear etiquetas de idioma es mantener la etiqueta lo más corta posible. Evite regiones, scripts u otras subetiquetas, excepto cuando agreguen información útil que lo distinga. Por ejemplo, use ja para japonés y no ja-JP, a menos que haya una razón particular por la que necesite decir que es japonés, como se habla en Japón, en lugar de en otro lugar.

La siguiente lista muestra los distintos tipos de subetiquetas disponibles. Trabajaremos a través de estos y cómo se usan en las secciones siguientes.

idioma-extlang-script-region-variant-extension-privateuse


La "mejor práctica actual" del IETF para las etiquetas de idioma se define en BCP 47 (RFC 5646 y RFC 4647). Sugiero dar una lectura, ya que explica mucho más sobre las etiquetas secundarias de idiomas de lo que alguna vez pensaste que necesitabas saber. :-)

Se refiere a la Subetiqueta de idiomas de IANA y a los registros de Extensiones de etiquetas de idiomas .


Puede usar cualquier código de país, sí, pero eso no significa que un navegador u otro software lo reconozca o haga algo diferente debido a eso. Por ejemplo, un lector de pantalla podría tratar lo mismo con "en-US" y "en-GB" si solo admiten un acento americano en inglés. Sin embargo, otra pieza de software que tiene dos voces distintas podría ajustarse de acuerdo con el código de país.


RFC 3066 proporciona los detalles de los valores permitidos (énfasis y enlaces agregados):

Todas las subetiquetas de 2 letras se interpretan como códigos de país ISO 3166 alpha-2 de [ISO 3166] , o subsecuentemente asignadas por la agencia de mantenimiento ISO 3166 o por los cuerpos normativos de normalización, indicando el área con la que se relaciona esta variante de idioma.

Lo interpreto como que cualquier código válido (de acuerdo con ISO 3166) de 2 letras es válido como subetiqueta. El RFC continúa diciendo:

Las etiquetas con segundas subetiquetas de 3 a 8 letras pueden registrarse en la IANA, de acuerdo con las reglas del capítulo 5 de este documento.

Por cierto, parece un error tipográfico, ya que el capítulo 3 parece estar relacionado con el proceso de registro, no con el capítulo 5.

Una búsqueda rápida del registro de IANA revela una lista muy larga , de todas las subetiquetas de idiomas disponibles. Aquí hay un ejemplo de la lista (que se usaría como en-scouse ):

Tipo: variante

Subetiqueta: scouse

Descripción: Scouse

Agregado el 2006-09-18

Prefijo: en

Comentarios: dialecto inglés Liverpudlian conocido como ''Scouse''

Hay todo tipo de subetiquetas disponibles; un desplazamiento rápido ya ha revelado fr-1694acad (francés del siglo XVII).

La utilidad de algunas de estas (diría que la gran mayoría de estas) etiquetas, cuando se trata de documentos diseñados para mostrar en el navegador, es limitada. La especificación de internacionalización W3C simplemente declara:

Los navegadores y otras aplicaciones pueden usar información sobre el idioma del contenido para entregar a los usuarios la información más adecuada, o para presentar información a los usuarios de la manera más adecuada. Mientras más contenido esté etiquetado y etiquetado correctamente, más útiles y generalizadas serán las aplicaciones.

Me cuesta encontrar información detallada sobre cómo se comportan los navegadores al encontrar diferentes etiquetas de idioma, pero lo más probable es que ofrezcan algún beneficio a los usuarios que usan un lector de pantalla, que puede usar la etiqueta para determinar el idioma / dialecto / acento para presentar el contenido