Na začiatku 90. rokov, keď sa zrútil ZSSR a otvorili sa hranice Ruska, sme začali dostávať softvérové produkty západnej výroby. Samozrejme, všetci hovorili anglicky. Internet sa zároveň začína rozvíjať. Problém rusifikácie zdrojov a programov sa stal akútnym. Potom bolo vynájdené ruské kódovanie Windows 1251. To vám umožňuje správne zobrazovať písmená slovanských abecedy:
- Ruský;
- ukrajinská;
- Bielorusku;
- Srbský;
- bulharská;
- macedónsky.
Vývoj uskutočnilo ruské zastúpenie spoločnosti Microsoft spolu so spoločnosťami „Dialóg“ a „Odsek“. Vychádzal sa z vývoja, ktorý si ľudia vytvorili sami a ktoré sa v rokoch 1990 - 1991 pohybovali medzi niekoľkými málo ideológmi v Rusku.
K dnešnému dňu bol vyvinutý univerzálnejší spôsob kódovania znakov - UTF-8 (Unicode). Predstavuje takmer 90% všetkých softvérových a webových zdrojov. Windows 1251 sa používa v 1,6% prípadov. (Informácie o výskume v oblasti webových technológií)
Kódovanie Utf 8 alebo Windows 1251?
Na zodpovedanie tejto otázky musíte trochu porozumieť tomu, čo je kódovanie a ako sa líšia. Textové informácie, ako aj všetky ostatné informácie, sa v počítači ukladajú v zakódovanej podobe. Je pre nás ľahšie ich reprezentovať ako čísla. Každá postava môže zaberať jeden alebo viac bajtov. Windows 1251 je jednobajtové kódovanie a UTF-8 je osembajt. To znamená, že v systéme Windows 1251 je možné kódovať iba 256 znakov..
Pretože to všetko spadá do binárneho systému a bajt je 8 bitov (0 a 1), maximálny počet kombinácií je 28 = 256. Unicode vám umožňuje reprezentovať oveľa väčší počet znakov a pre každú veľkosť je možné priradiť väčšiu veľkosť..
Odtiaľto vyplývajú výhody Unicode:
- V záhlaví stránky by malo byť uvedené použité kódovanie. V opačnom prípade sa namiesto znakov zobrazia „krokodíly“. A Unicode je štandardom pre všetky prehliadače - predvolene ho zachytia za chodu.
- Symboly lokality zostanú rovnaké bez ohľadu na to, v ktorej krajine je zdroj načítaný. Nezávisí to od geografického umiestnenia serverov, ale od softvérového jazyka klientskych pracovných staníc. Obyvateľ Portugalska zjavne používa klávesnicu a všetok softvér vrátane operačného systému vo svojom rodnom jazyku. Pravdepodobne v jeho počítači nie je systém Windows 1251. A ak áno, stránky v ruštine sa neotvoria správne. Unicode je zase „zapojený“ do ľubovoľného operačného systému v akomkoľvek jazyku.
- UTF-8 umožňuje kódovať viac znakov. V súčasnosti sa používa 6 bajtov z 8 a ruské znaky sa kódujú v dvoch bajtoch.
Preto je vhodnejšie použiť univerzálne kódovanie než vysoko špecializované, ktoré sa používa iba v slovanských krajinách.
Windows 1251 Kódovacia tabuľka
Pre programátorov a vývojárov webových stránok môže byť potrebné poznať čísla znakov. Na tento účel sa používajú špeciálne tabuľky kódovania. Nižšie je tabuľka pre Windows 1251.
Čo robiť, ak došlo k kódovaniu príkazového riadka?
Niekedy sa môžete stretnúť so situáciou, keď sa na ruskom príkazovom riadku zobrazia nepochopiteľné znaky. To znamená, že sa vyskytol problém s kódovaním príkazového riadka systému Windows 7. Prečo 7? Pretože od 8. verzie sa používa UTF-8 a v siedmich Windows 1251.
Príkaz CHF 866 môže pomôcť vyriešiť problém súčasne. Aktuálna relácia bude pracovať správne. Ak však chcete chybu dramaticky opraviť, potrebujete register.
- Stlačte Win + R a napíšte regedit. To vám umožní sa dostať do editora registra..
- Prejdite do vetvy HKEY_CURRENT_USER \ Console a zistite, aká je hodnota pre CodePage rovnaká. S najväčšou pravdepodobnosťou uvidíte niečo iné ako 866 (správna možnosť).
- Opravte na 866 desatinných miest.
- Zatvorte a znova otvorte príkazový riadok. Situácia by sa mala napraviť.
Prajem pekný deň!