Mojibake

Моджибаке (文字化け, произнася се /моджибаке/) е наименованието на неправилните, нечетливи символи, които се показват, когато компютърният софтуер не успява да покаже правилно текста. При използване на компютри текстът се кодира с помощта на кодиране на символи. При прехвърлянето всеки символ се заменя с неговата позиция (или номер) в кодирането. За да се покаже знакът отново, позицията отново се заменя със знака. Когато първоначалното кодиране не е посочено, може да се използва различен символ, когато номерът отново се замени със символа за показване. Уникод е въведен, за да реши този проблем: UTF-8 е в състояние да кодира най-често срещаните символи в 2 байта.

Преди въвеждането на Уникод са се използвали други кодировки на символи. Например ISO-8859 съдържа 15 различни кодировки. Те са еднакви за знаците, които обикновено се използват в английския език. Те имат няколко "блока" от "специални символи", които се подават по различен начин за всяко кодиране.



Ето как може да изглежда уебсайт, ако е използвано неправилно кодиране на шрифта.Zoom
Ето как може да изглежда уебсайт, ако е използвано неправилно кодиране на шрифта.

Статията за Mojibake в японската Уикипедия използва кодиране UTF-8. Тази снимка на екрана показва как изглежда тя, когато е декодирана с помощта на стандартното кодиране CP1252 на Windows.Zoom
Статията за Mojibake в японската Уикипедия използва кодиране UTF-8. Тази снимка на екрана показва как изглежда тя, когато е декодирана с помощта на стандартното кодиране CP1252 на Windows.

Произход на думата

Mojibake е японска дума. Думата 文字化け ([моʥибаке]) е съставена от две части. 文字 (мои) означава буква, символ. 化け (bake), от глагола 化ける (bakeru), означава появявам се маскиран, приемам формата на, променям се към по-лошо. Буквално означава "мутация на характера".



Въпроси и отговори

В: Какво е "мохибаке"?


О: Мохибаке е термин за неправилни и нечетими символи, които се появяват, когато компютърният софтуер не успява да покаже правилно текста.

В: Как се кодира текстът при използване на компютри?


О.: Текстът се кодира с помощта на символно кодиране, при което всеки символ се заменя с позицията или номера си в кодирането.

В: Какво се случва, когато при прехвърляне на текст не е посочено оригиналното кодиране?


О: Когато не е посочено оригиналното кодиране, може да се използва различен символ, когато числото се замества със символа за показване.

Въпрос: Какво представлява Unicode и как решава този проблем?


О: Unicode е стандарт за кодиране на символи, който може да представи повечето символи в два байта. Той решава проблема с използването на различни кодировки на символи и гарантира, че символите се показват правилно.

Въпрос: Какви са някои примери за други кодировки на символи, които са били използвани преди Unicode?


О: ISO-8859 е пример за друго кодиране на символи, което е било използвано преди Unicode.

В: Колко различни кодировки съдържа ISO-8859?


О: ISO-8859 съдържа 15 различни кодировки.

В: Специалните символи в ISO-8859 еднакви ли са за всички негови кодировки?


О: Не, специалните знаци в ISO-8859 се подават по различен начин за всяко кодиране.

AlegsaOnline.com - 2020 / 2023 - License CC3