Подреждане по азбучен ред: значение, правила и примери
Подреждането по азбучен ред е начин за сортиране (организиране) на списък. То помага на читателя бързо да намери име или заглавие в каталози, речници, указатели и бази данни. Подреждането следва стандартният (обичайният) ред на буквите в дадената азбука. Исторически някои форми на азбучно сортиране са били използвани още по време на ранната Римска империя, а методите стават по-унифицирани и разпространени след Ренесанса.
Подреждането в английския език и в повечето езици с латинска графика се извършва с помощта на римската азбука. Различните езици и култури обаче имат свои правила за сортиране: някои третират буквите с диакритични знаци като отделни букви, други ги приравняват на базовата буква или ги заместват с комбинация от букви. Освен това съществуват различни подходи за сортиране на числа, пунктуация и специални символи (например как да се подреждат букви с диакритични знаци или символи като &, # и т.н.). На немски език често срещаните специални знаци са ä, ö, ü и ß.
Основни принципи и правила
- Подреждането обикновено сравнява думите буква по буква отляво надясно: първо се сравнява първата буква, ако са равни — втората и т.н.
- Сортировката обикновено е нечувствителна към главни/малки букви (case-insensitive): "анна" и "Анна" се третират еднакво.
- Често се игнорират водещи членове и артикли при сортиране на заглавия (напр. "The", "A", "An" в английски; в български — „на“, „за“ и т.н. — зависи от правилата на източника).
- Пунктуация, интервали и тирета може да се игнорират или да им се зададе фиксиран приоритет (някои системи третираха интервала като преди буквите).
- Числата могат да се сортират лексикографски (като текст: 1, 10, 2) или числово (като стойност: 1, 2, 10) — изборът зависи от приложението.
Специфики при букви с диакритични знаци (пример: немски)
За буквите с диакритични знаци има няколко практики. Два често срещани варианта при немския са:
- Първи вариант: буквата с диакритични знаци се третира по същия начин като тази без диакритични знаци — ä се третира като a, ö като o и ü като u. (Известен като DIN 5007-1, обикновено се използва за енциклопедии.)
- Втори вариант: буквата се третира по същия начин като някаква замяна: ä се заменя с ae, ö с oe, ü с ue, а ß с ss (известен като DIN 5007-2, използван за телефонни указатели).
Обърнете внимание, че практиките се различават според езика и локала: в датския език букви като ä/å/æ се подреждат различно — някои от тях стоят след z, а не се приравняват към a, както в немския.
Подреждане в българския език (кирилска азбука)
За българския език се използва кирилската азбука. Официалният ред на съвременната българска азбука е:
А, Б, В, Г, Д, Е, Ж, З, И, Й, К, Л, М, Н, О, П, Р, С, Т, У, Ф, Х, Ц, Ч, Ш, Щ, Ъ, Ь, Ю, Я.
Някои важни бележки за български:
- Буквата Й върви след И, т.е. всичко започващо с И се подрежда преди това с Й (например: Иван, Игнат, Йордан).
- Мекият знак (Ь) и твърдият (Ъ) са отделни букви в азбуката и имат своето място при сортиране.
- При комбинации с латински символи или транслитерации може да се наложи да се дефинира правило — дали латинските имена да се третират по ASCII/латински ред или да се транслитерират и сортират по кирилски.
Примери
Пример за основно азбучно сортиране (кирилско):
- Александър
- Борис
- Васил
- Георги
Илюстрация на сравняване буква по буква: редът на имената Иван, Игнат, Йордан е:
- Иван (И-в...)
- Игнат (И-г...)
- Йордан (Й-...)
Пример за числово срещу лексикографско сортиране:
- Лексикографски (текстово): 1, 10, 2
- Числово (по стойност): 1, 2, 10
Програмни и практически съвети
- За коректно сортиране във софтуер използвайте локално-осъзнати функции за сравнение (например strcoll в C, Collator в ICU, или COLLATE в SQL), вместо просто да сравнявате байтове/ASCII.
- Бъдете внимателни при комбиниране на текст на различни езици в един списък — задайте локал (locale) или политика за транслитерация/приравняване на диакритични знаци.
- Документирайте избраните правила (напр. дали игнорирате артиклите, как третирате диакритичните букви, как се сортират числата), за да бъде сортирането предсказуемо и възпроизводимо.
- За печатни каталози и енциклопедии често се използва различен стандарт отколкото за телефонни указатели или бази данни; проверете съответните стандарти за вашия случай.
Правилното подреждане по азбучен ред улеснява намирането на информация и прави списъците по-удобни за ползване. Изборът на конкретни правила зависи от езика, предназначението на списъка и техническата среда, в която се реализира сортирането.
Български
Списъкът с елементи като Ерик, Лидия, Андреа и Боб е организиран по първата им буква. А е преди Б, Б е преди Д, а Д е преди Л в азбуката. Когато се използва азбучен ред:
- Андреа
- Боб
- Ерик
- Лидия
Ако много думи имат една и съща първа буква, те се подреждат по вторите си букви.
- Лари
- Леонард
- Линда
- Лидия
След това се използват третата и четвъртата буква, докато целият списък бъде сортиран.
Думите a, an и the се пренебрегват. Понякога те се пишат в края, след запетая. Интервалите и тиретата ( - ) също се игнорират.
- Дългодневно пътуване в нощта (A Long Day's Journey Into Night)
- Дългото сбогуване
- На ръка: Тетрадка на писателя
- Дългият път към дома
- Дълго пътуване обратно
- Дългата разходка
Формула може да се използва за систематично игнориране на a, an и the. За Microsoft Excel това е:
=IF(LEFT(A2,2)="A ",RIGHT(A2,LEN(A2)-2),IF(LEFT(A2,3)="An ",RIGHT(A2,LEN(A2)-3),IF(LEFT(A2,4)="The ",RIGHT(A2, LEN(A2)-4),A2)))
Това може да се опише и по следния начин:
- Пътуване през дългия ден в нощта, А
- Дългото сбогуване, The
- На ръка: Тетрадка на писателя
- Дългият път към дома, The
- Дълго пътуване обратно
- Дългата разходка, The
Имената обикновено се подреждат по фамилно, а не по собствено име.
- Джийн Хакман
- Том Ханкс
- Катрин Хепбърн
- Дженифър Лав Хюит
Имената често се изписват с първите фамилни имена.
- Hackman, Gene
- Ханкс, Том
- Хепбърн, Катрин
- Хюит, Дженифър Лав
Числата могат да се сортират по два начина. Понякога те се подреждат от най-малкия до най-големия. Това е нормалният начин за сортиране на числата.
- 1
- 3
- 9
- 18
- 27
- 81
В други случаи те могат да бъдат подредени така, сякаш са нормални, изписани думи. Този начин често се използва за числата в заглавията.
- Осемнадесет
- Осемдесет и един
- Девет
- Един
- Три
- Двадесет и седем
Въпроси и отговори
В: Какво представлява азбучният ред?
О: Азбучният ред е начин за сортиране (организиране) на списък, като се следва стандартният (обичайният) ред на буквите в азбуката.
В: Кога е използван за първи път?
О: Азбучният ред е използван за първи път по време на ранната Римска империя и става обичаен след Ренесанса.
В: Как се прави сортиране в английския език?
О: Сортирането на нещата в английския език се извършва с помощта на римската азбука.
В: Има ли различни правила за сортиране в зависимост от езика?
О: Да, различните езици имат различни правила за сортиране.
В: Как числата се сортират по различен начин от думите или символите?
О: Има различни начини за сортиране на числата и специалните символи, като например букви с диакритични знаци.
В: Как немскоговорящите третират буквите с диакритични знаци при сортиране?
О: Немскоговорящите могат или да третират буквата с диакритични знаци по същия начин като тази без тях (познато като DIN 5007-1, обикновено се използва за енциклопедии), или да ги заменят с някакъв друг знак (познато като DIN 5007-2, използва се за телефонни указатели).
Въпрос: Това правило важи ли за всички езици, които използват диакритични знаци? О: Не, това правило може да се различава в зависимост от езика; датският език също има буква ن, но я подрежда след z и не я третира като a, както в немския.