Saltar al contenido

Diferencias de formato Unicode, UTF, ASCII, ANSI

Hemos buscado en todo el mundo on line y así mostrarte la solución para tu inquietud, si tienes alguna difcultad puedes dejarnos tu duda y responderemos porque estamos para ayudarte.

Solución:

Bajando tu lista:

  • “Unicode” no es una codificación, aunque desafortunadamente, mucha documentación lo usa de manera imprecisa para referirse a cualquier codificación Unicode que ese sistema en particular use de manera predeterminada. En Windows y Java, esto a menudo significa UTF-16; en muchos otros lugares, significa UTF-8. Correctamente, Unicode se refiere al conjunto de caracteres abstractos en sí, no a ninguna codificación en particular.
  • UTF-16: 2 bytes por “unidad de código”. Este es el formato nativo de cadenas en .NET y, en general, en Windows y Java. Los valores fuera del plano multilingüe básico (BMP) se codifican como pares sustitutos. Estas solía ser se usa con relativa poca frecuencia, pero ahora muchas aplicaciones de consumo deberán tener en cuenta los caracteres que no son BMP para admitir emojis.
  • UTF-8: Codificación de longitud variable, 1-4 bytes por punto de código. Los valores ASCII se codifican como ASCII usando 1 byte.
  • UTF-7: generalmente se usa para la codificación de correo. Lo más probable es que si crees que lo necesitas y no estás haciendo correo, estés equivocado. (Esa es solo mi experiencia de personas que publican en grupos de noticias, etc., correo externo, en realidad no se usa mucho).
  • UTF-32: Codificación de ancho fijo usando 4 bytes por punto de código. Esto no es muy eficiente, pero facilita la vida fuera del BMP. tengo una .NET Utf32String class como parte de mi biblioteca MiscUtil, si alguna vez lo desea. (No se ha probado muy a fondo, eso sí).
  • ASCII: Codificación de un solo byte utilizando solo los 7 bits inferiores. (Puntos de código Unicode 0-127.) Sin acentos, etc.
  • ANSI: no hay una codificación ANSI fija, hay muchas. Por lo general, cuando las personas dicen “ANSI”, se refieren a “la configuración regional/página de códigos predeterminada para mi sistema”, que se obtiene a través de Encoding.Default, y suele ser Windows-1252, pero pueden ser otras configuraciones regionales.

Hay más en mi página de Unicode y consejos para depurar problemas de Unicode.

El otro gran recurso de código es unicode.org, que contiene más información de la que jamás podrá trabajar; posiblemente, la parte más útil son los gráficos de códigos.

Algunas lecturas para comenzar con la codificación de caracteres: Joel sobre el software: el mínimo absoluto que todo desarrollador de software debe saber absoluta y positivamente sobre Unicode y conjuntos de caracteres (¡sin excusas!)

Por cierto, ASP.NET no tiene nada que ver con eso. Las codificaciones son universales.

Puedes apoyar nuestra tarea mostrando un comentario y dejando una puntuación te damos las gracias.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *