Codificación


En los primeros tiempos de la informática, el lenguaje y los caracteres más habitualmente usados eran los anglosajones. Para hacer uso de ellos y codificarlos en los ordenadores se ideó el ASCII. Esta forma de codificación (encoding en inglés) almacena cada carácter en un byte.
Naturalmente, en otros países como los asiáticos (e incluso en España, con nuestra ñ) la codificación no era suficiente. Prácticamente en cada zona la solución que se dió fue diferentes. Y con la llegada de internet y la globalización, el problema se intensificó. ¿Cómo iba a conseguirse que programas codificados de diferentes formas se entendieran entre si? Imagínate uno codificado escrito en japonés y otro en francés...
Afortunadamente, hay un estamento oficial que vela por todo ello y han surgido soluciones. Actualmente, una de las codificaciones más extendidas es UTF-8 ( unicode ) y permite utilizar cualquier idioma del mundo.
En Python, si vamos a utilizar una codificación distinta de la anglosajona (como es el caso en español, pues usamos acentos y demás) hay que indicárselo poniendo la siguiente línea como la primera del programa:
# -*- coding: utf-8 -*-
(en realidad, puede ponerse otro tipo de codificación, pero como hemos dicho, utf-8 es la más general).