ASCII кодиране. ASCII таблица за кодиране

Чрез кодиране на информация в компютър се отнася до процеса на преобразуването му във форма, която позволява организирането на по-удобно предаване, съхранение или автоматична обработка на тези данни. За тази цел се използват различни таблици. ASCII кодирането е първата система, разработена в Съединените щати за работа с английски текст, който впоследствие се разпространява в целия свят. Неговото описание, характеристики, свойства и по-нататъшна употреба са посветени на статията по-долу.

Показване и съхраняване на информация в компютър

Символите на компютърен монитор или мобилна цифрова притурка се формират на базата на множества от векторни форми на различни кодови символи, което ви позволява да намерите сред тях символа, който трябва да се вмъкне има нужда от място. Това е поредица от битове. По този начин всеки знак трябва да съответства на набор от нули и единици, които са в определен, уникален ред.

Как започна всичко

Исторически, първите компютри бяха англоговорящи. За да се кодира символната информация в тях, достатъчно е да се използват само 7 бита памет, докато за тази цел се разпределя 1 байт, състоящ се от 8 бита. Броят на знаците, разбираеми от компютъра в този случай, е само 128. Тези символи се състоят от английската азбука с нейните пунктуационни знаци, цифри и някои специални символи. Седембитовото кодиране на английски език със съответната таблица (кодова страница), разработено през 1963 г., се нарича Американски стандартен код за информацияInterchange. Обикновено съкращението "ASCII кодиране" е използвано и използвано за неговото обозначаване.

Преход към многоезичието

С течение на времето компютрите се използват широко в страни, които не говорят английски. Във връзка с това имаше нужда от кодиране, което позволява използването на национални езици. Беше решено да не се преоткрива моторът и да се основава ASCII. Кодиращата таблица в новото издание значително се разшири. Използването на 8-ми бит ви позволява да преведете 256 символа на компютърния език.

Описание

ASCII кодирането има таблица, която е разделена на 2 части. Общоприетият международен стандарт се счита само за първата му половина. Тя включва:
  • Символи с последователни номера от 0 до 31 кодирани последователности от 00000000 до 00011111. Те ​​са запазени за контролни знаци, които контролират процеса на извеждане на текст към екрана или принтера, чрез звуков сигнал и др. 15) NN символите в таблицата от 32 до 127 кодирани последователности от 00100000 до 01111111 образуват стандартната част на таблицата. Те включват пространство (N 32), букви от латинската азбука (големи и малки), десетцифрени числа от 0 до 9 препинателни знака, скоби на различни линии и други символи.
  • Символи със серийни номера от 128 до 255, кодирани от последователности от 10 000 000 до 11 000. Те включват букви, различни от латински. Именно тази алтернативна част от ASCII кодиращата таблица, използвана за преобразуване на руските символи в компютърна форма.
  • Някои свойства

    Функциите за кодиране ASCII включват съкращението на долните и горните букви "А" до "Z" само един бит. Това обстоятелство значително опростява преобразуването на регистъра, както и неговата проверка за принадлежност към даден диапазон от стойности. В допълнение, всички букви в ASCII кодиращата система са представени със собствените им последователни номера в азбуката, които са написани с 5 цифри в двоичната система, пред които буквите за долния регистър са 011 2, а горните са 010 2.
    Сред характеристиките на ASCII кодирането, можете да преброите представянето на 10 цифри - "0" - "9". Във втората система те започват с 00112 и завършват с 2 стойности на числа. Така, 0101 2 е еквивалентно на десетично число от пет, така че "5" е записано като 001101012. Въз основа на горното можете лесно да конвертирате бинарни десетични числа в низ в ASCII кодиране чрез добавяне на лявата битова последователност от 00112 към всеки полубайт.

    Unicode

    Както знаете, хиляди знаци са необходими за показване на текстове на езиците на групата на Югоизточна Азия. Такова количество не е описано в нито един байт от информация, затова дори разширени версии на ASCII вече не могат да отговарят на нарастващите нужди на потребителите от различни страни.

    По този начин съществува необходимост от универсално текстово кодиране, чието разработване, в сътрудничество с много лидери на глобалната ИТ индустрия, пое консорциума Unicode. Нейните специалисти създадоха система UTF 32. В нея, за да кодира 1 знак, разпределени 32 бита, състоящи се от 4 байта информация. Основното нещоНедостатъкът е рязкото увеличаване на обема на паметта, което изисква 4 пъти, което е свързано с много проблеми. В същото време, за повечето страни с официални езици, принадлежащи към индоевропейската група, броят на марките, равен на 2 32, е повече от излишък. В резултат на по-нататъшната работа на специалисти от консорциума Unicode се появи кодировката UTF-16. Това стана опцията за конвертиране на символна информация, която се подреждаше както от количеството на необходимата памет, така и от броя на кодираните символи. Ето защо UTF-16 е приет по подразбиране и в него за един знак е необходимо да се запазят 2 байта. Дори тази доста напреднала и успешна Unicode версия имаше някои недостатъци и след като премина от разширената версия на ASCII на UTF-16, теглото на документа се удвои. В тази връзка беше решено да се използва UTF-8 кодиране с променлива дължина. В този случай всеки символ на изходния текст се кодира в последователност от 1 до 6 байта по дължина.

    Връзка с американския стандартен код за обмен на информация

    Всички символи в латинската азбука в UTF-8 с променлива дължина са кодирани в 1 байт, както е в системата за кодиране ASCII. Функцията на UTF-8 е, че ако текстът е на латиница без използването на други символи, дори програми, които не разбират Unicode, ще продължат да го позволяват да бъдат четени. С други думи, основната част от кодирането на ASCII текст просто преминава в новата променлива дължина на UTF. Кирилиците в UTF-8 заемат 2 байта, а например грузински - 3 байта. Създаването на UTF-16 и 8 разреши основния проблем при създаването на едно кодово пространство в шрифтовете. сОттогава производителите на шрифтове могат да попълват таблицата само с векторни форми на текстови знаци, съобразно техните нужди.
    Различните операционни системи предпочитат различни кодировки. За да могат да четат и редактират текстове, написани в различно кодиране, се използват руски програми за транскодиране на текст. Някои текстови редактори съдържат вградени енкодери и ви позволяват да четете текст независимо от кодирането.
    Сега знаете колко символа в ASCII кодирането и как и защо е бил разработен. Разбира се, днес най-разпространеното в света е получило стандартния Unicode. Не бива обаче да се забравя, че той се основава на ASCII, така че стойността на нейните разработчици в областта на информационните технологии трябва да бъде оценена правилно.

    Свързани публикации