ТЪРСИ

Кодиране на текстова информация на компютъра

Компютърът е сложно устройство, което използвакоито можете да създавате, конвертирате и съхранявате информация. Компютърът обаче не работи по начин, който не е напълно ясен за нас - графичните, текстовите и цифровите данни се съхраняват като масиви от двоични данни.

текстово кодиране
номера. В тази статия ще разгледаме как се кодира текстовата информация.

Какво е текстът за нас, за компютрите -поредица от знаци. Всеки знак е специфичен набор от нули и такива. Символите означават не само малки и главни букви на латиницата, но и препинателни знаци, аритметични знаци, сервизни символи, специални символи и дори пространство.

Бинарно кодиране на текстова информация

Когато натиснете определен клавиш на вътрешнияКонтролерът изпраща електрически сигнал, който се преобразува в двоичен код. Кодът е присвоен към конкретен знак, който се показва на екрана. За да се представи латинската азбука в цифров формат, беше създадена международна система за кодиране ASCII. Това изисква 1 байт за запис на един знак, следователно символът се състои от осемцифрена последователност от нули и такива. Интервалът за запис е от 00000000 до 11111111, т.е. кодирането на текстова информация, използвайки тази система, ви позволява да представите 256 знака. В повечето случаи това е достатъчно.

двойно кодиране на текстова информация

ASCII е разделена на две части. Първите 127 знака (от 00000000 до 01111111) са международни и представляват конкретни букви и букви на английската азбука. Втората част, разширяването (от 10 000 000 на 1 111 000), има за цел да представлява националната азбука, чието написване е различно от латинското.

ASCII текстово кодираневъз основа на принципа на нарастващата последователност, т.е. колкото по-голям е поредният номер на латинската буква, толкова по-голяма е стойността на нейния ASCII код. Номерата и руската част на таблицата са изградени на същия принцип.

Има обаче и други видове в света.кодировки за кирилица. Най-често срещаните са KOI-8 (осем-битово кодиране, което вече е използвано през 70-те години на първите унифицирани операционни системи Unix), ISO 8859-5 (разработено от Международното бюро по стандартизация), CP 1251

текстово кодиране и обработка
модерни Windows), както и 2 байтаUnicode кодиране, което може да се използва за представяне на 65,536 знака. Такова разнообразие от кодировки се дължи на факта, че всички те са разработени в различно време, за различни операционни системи и по различни причини. Поради това често е трудно да се прехвърля текст от една медия в друга - ако кодовете не съвпадат, потребителят ще види само набор от неразбираеми икони. Как мога да поправя тази ситуация? В Word, например, когато отваряте документ, получавате съобщение за проблеми с показването на текст и предлагате няколко опции за прекодиране.

Така че, кодиране на текст и обработкаинформация в дълбините на компютъра - процесът е доста сложен и отнема време. Всички знаци на всяка азбука представляват само определена последователност от цифри на двоичната система, една клетка е един байт информация.

  • Оценка: