Windows 1251 Kódovanie

Na začiatku 90. rokov, keď sa zrútil ZSSR a otvorili sa hranice Ruska, sme začali dostávať softvérové ​​produkty západnej výroby. Samozrejme, všetci hovorili anglicky. Internet sa zároveň začína rozvíjať. Problém rusifikácie zdrojov a programov sa stal akútnym. Potom bolo vynájdené ruské kódovanie Windows 1251. To vám umožňuje správne zobrazovať písmená slovanských abecedy:

  • Ruský;
  • ukrajinská;
  • Bielorusku;
  • Srbský;
  • bulharská;
  • macedónsky.

Vývoj uskutočnilo ruské zastúpenie spoločnosti Microsoft spolu so spoločnosťami „Dialóg“ a „Odsek“. Vychádzal sa z vývoja, ktorý si ľudia vytvorili sami a ktoré sa v rokoch 1990 - 1991 pohybovali medzi niekoľkými málo ideológmi v Rusku.

K dnešnému dňu bol vyvinutý univerzálnejší spôsob kódovania znakov - UTF-8 (Unicode). Predstavuje takmer 90% všetkých softvérových a webových zdrojov. Windows 1251 sa používa v 1,6% prípadov. (Informácie o výskume v oblasti webových technológií)

Kódovanie Utf 8 alebo Windows 1251?

Na zodpovedanie tejto otázky musíte trochu porozumieť tomu, čo je kódovanie a ako sa líšia. Textové informácie, ako aj všetky ostatné informácie, sa v počítači ukladajú v zakódovanej podobe. Je pre nás ľahšie ich reprezentovať ako čísla. Každá postava môže zaberať jeden alebo viac bajtov. Windows 1251 je jednobajtové kódovanie a UTF-8 je osembajt. To znamená, že v systéme Windows 1251 je možné kódovať iba 256 znakov..
Pretože to všetko spadá do binárneho systému a bajt je 8 bitov (0 a 1), maximálny počet kombinácií je 28 = 256. Unicode vám umožňuje reprezentovať oveľa väčší počet znakov a pre každú veľkosť je možné priradiť väčšiu veľkosť..

Odtiaľto vyplývajú výhody Unicode:

  1. V záhlaví stránky by malo byť uvedené použité kódovanie. V opačnom prípade sa namiesto znakov zobrazia „krokodíly“. A Unicode je štandardom pre všetky prehliadače - predvolene ho zachytia za chodu.
  2. Symboly lokality zostanú rovnaké bez ohľadu na to, v ktorej krajine je zdroj načítaný. Nezávisí to od geografického umiestnenia serverov, ale od softvérového jazyka klientskych pracovných staníc. Obyvateľ Portugalska zjavne používa klávesnicu a všetok softvér vrátane operačného systému vo svojom rodnom jazyku. Pravdepodobne v jeho počítači nie je systém Windows 1251. A ak áno, stránky v ruštine sa neotvoria správne. Unicode je zase „zapojený“ do ľubovoľného operačného systému v akomkoľvek jazyku.
  3. UTF-8 umožňuje kódovať viac znakov. V súčasnosti sa používa 6 bajtov z 8 a ruské znaky sa kódujú v dvoch bajtoch.
    Preto je vhodnejšie použiť univerzálne kódovanie než vysoko špecializované, ktoré sa používa iba v slovanských krajinách.

Windows 1251 Kódovacia tabuľka

Pre programátorov a vývojárov webových stránok môže byť potrebné poznať čísla znakov. Na tento účel sa používajú špeciálne tabuľky kódovania. Nižšie je tabuľka pre Windows 1251.

Čo robiť, ak došlo k kódovaniu príkazového riadka?

Niekedy sa môžete stretnúť so situáciou, keď sa na ruskom príkazovom riadku zobrazia nepochopiteľné znaky. To znamená, že sa vyskytol problém s kódovaním príkazového riadka systému Windows 7. Prečo 7? Pretože od 8. verzie sa používa UTF-8 a v siedmich Windows 1251.
Príkaz CHF 866 môže pomôcť vyriešiť problém súčasne. Aktuálna relácia bude pracovať správne. Ak však chcete chybu dramaticky opraviť, potrebujete register.

  1. Stlačte Win + R a napíšte regedit. To vám umožní sa dostať do editora registra..
  2. Prejdite do vetvy HKEY_CURRENT_USER \ Console a zistite, aká je hodnota pre CodePage rovnaká. S najväčšou pravdepodobnosťou uvidíte niečo iné ako 866 (správna možnosť).
  3. Opravte na 866 desatinných miest.
  4. Zatvorte a znova otvorte príkazový riadok. Situácia by sa mala napraviť.

Prajem pekný deň!