Подреждане по азбучен ред: значение, правила и примери

Подреждането по азбучен ред е начин за сортиране (организиране) на списък. То помага на читателя бързо да намери име или заглавие в каталози, речници, указатели и бази данни. Подреждането следва стандартният (обичайният) ред на буквите в дадената азбука. Исторически някои форми на азбучно сортиране са били използвани още по време на ранната Римска империя, а методите стават по-унифицирани и разпространени след Ренесанса.

Подреждането в английския език и в повечето езици с латинска графика се извършва с помощта на римската азбука. Различните езици и култури обаче имат свои правила за сортиране: някои третират буквите с диакритични знаци като отделни букви, други ги приравняват на базовата буква или ги заместват с комбинация от букви. Освен това съществуват различни подходи за сортиране на числа, пунктуация и специални символи (например как да се подреждат букви с диакритични знаци или символи като &, # и т.н.). На немски език често срещаните специални знаци са ä, ö, ü и ß.

Основни принципи и правила

  • Подреждането обикновено сравнява думите буква по буква отляво надясно: първо се сравнява първата буква, ако са равни — втората и т.н.
  • Сортировката обикновено е нечувствителна към главни/малки букви (case-insensitive): "анна" и "Анна" се третират еднакво.
  • Често се игнорират водещи членове и артикли при сортиране на заглавия (напр. "The", "A", "An" в английски; в български — „на“, „за“ и т.н. — зависи от правилата на източника).
  • Пунктуация, интервали и тирета може да се игнорират или да им се зададе фиксиран приоритет (някои системи третираха интервала като преди буквите).
  • Числата могат да се сортират лексикографски (като текст: 1, 10, 2) или числово (като стойност: 1, 2, 10) — изборът зависи от приложението.

Специфики при букви с диакритични знаци (пример: немски)

За буквите с диакритични знаци има няколко практики. Два често срещани варианта при немския са:

  • Първи вариант: буквата с диакритични знаци се третира по същия начин като тази без диакритични знаци — ä се третира като a, ö като o и ü като u. (Известен като DIN 5007-1, обикновено се използва за енциклопедии.)
  • Втори вариант: буквата се третира по същия начин като някаква замяна: ä се заменя с ae, ö с oe, ü с ue, а ß с ss (известен като DIN 5007-2, използван за телефонни указатели).

Обърнете внимание, че практиките се различават според езика и локала: в датския език букви като ä/å/æ се подреждат различно — някои от тях стоят след z, а не се приравняват към a, както в немския.

Подреждане в българския език (кирилска азбука)

За българския език се използва кирилската азбука. Официалният ред на съвременната българска азбука е:

А, Б, В, Г, Д, Е, Ж, З, И, Й, К, Л, М, Н, О, П, Р, С, Т, У, Ф, Х, Ц, Ч, Ш, Щ, Ъ, Ь, Ю, Я.

Някои важни бележки за български:

  • Буквата Й върви след И, т.е. всичко започващо с И се подрежда преди това с Й (например: Иван, Игнат, Йордан).
  • Мекият знак (Ь) и твърдият (Ъ) са отделни букви в азбуката и имат своето място при сортиране.
  • При комбинации с латински символи или транслитерации може да се наложи да се дефинира правило — дали латинските имена да се третират по ASCII/латински ред или да се транслитерират и сортират по кирилски.

Примери

Пример за основно азбучно сортиране (кирилско):

  • Александър
  • Борис
  • Васил
  • Георги

Илюстрация на сравняване буква по буква: редът на имената Иван, Игнат, Йордан е:

  • Иван (И-в...)
  • Игнат (И-г...)
  • Йордан (Й-...)

Пример за числово срещу лексикографско сортиране:

  • Лексикографски (текстово): 1, 10, 2
  • Числово (по стойност): 1, 2, 10

Програмни и практически съвети

  • За коректно сортиране във софтуер използвайте локално-осъзнати функции за сравнение (например strcoll в C, Collator в ICU, или COLLATE в SQL), вместо просто да сравнявате байтове/ASCII.
  • Бъдете внимателни при комбиниране на текст на различни езици в един списък — задайте локал (locale) или политика за транслитерация/приравняване на диакритични знаци.
  • Документирайте избраните правила (напр. дали игнорирате артиклите, как третирате диакритичните букви, как се сортират числата), за да бъде сортирането предсказуемо и възпроизводимо.
  • За печатни каталози и енциклопедии често се използва различен стандарт отколкото за телефонни указатели или бази данни; проверете съответните стандарти за вашия случай.

Правилното подреждане по азбучен ред улеснява намирането на информация и прави списъците по-удобни за ползване. Изборът на конкретни правила зависи от езика, предназначението на списъка и техническата среда, в която се реализира сортирането.

Български

Списъкът с елементи като Ерик, Лидия, Андреа и Боб е организиран по първата им буква. А е преди Б, Б е преди Д, а Д е преди Л в азбуката. Когато се използва азбучен ред:

  • Андреа
  • Боб
  • Ерик
  • Лидия

Ако много думи имат една и съща първа буква, те се подреждат по вторите си букви.

  • Лари
  • Леонард
  • Линда
  • Лидия

След това се използват третата и четвъртата буква, докато целият списък бъде сортиран.

Думите a, an и the се пренебрегват. Понякога те се пишат в края, след запетая. Интервалите и тиретата ( - ) също се игнорират.

  • Дългодневно пътуване в нощта (A Long Day's Journey Into Night)
  • Дългото сбогуване
  • На ръка: Тетрадка на писателя
  • Дългият път към дома
  • Дълго пътуване обратно
  • Дългата разходка

Формула може да се използва за систематично игнориране на a, an и the. За Microsoft Excel това е:

=IF(LEFT(A2,2)="A ",RIGHT(A2,LEN(A2)-2),IF(LEFT(A2,3)="An ",RIGHT(A2,LEN(A2)-3),IF(LEFT(A2,4)="The ",RIGHT(A2, LEN(A2)-4),A2)))

Това може да се опише и по следния начин:

  • Пътуване през дългия ден в нощта, А
  • Дългото сбогуване, The
  • На ръка: Тетрадка на писателя
  • Дългият път към дома, The
  • Дълго пътуване обратно
  • Дългата разходка, The

Имената обикновено се подреждат по фамилно, а не по собствено име.

  • Джийн Хакман
  • Том Ханкс
  • Катрин Хепбърн
  • Дженифър Лав Хюит

Имената често се изписват с първите фамилни имена.

  • Hackman, Gene
  • Ханкс, Том
  • Хепбърн, Катрин
  • Хюит, Дженифър Лав

Числата могат да се сортират по два начина. Понякога те се подреждат от най-малкия до най-големия. Това е нормалният начин за сортиране на числата.

  • 1
  • 3
  • 9
  • 18
  • 27
  • 81

В други случаи те могат да бъдат подредени така, сякаш са нормални, изписани думи. Този начин често се използва за числата в заглавията.

  • Осемнадесет
  • Осемдесет и един
  • Девет
  • Един
  • Три
  • Двадесет и седем
 

Въпроси и отговори

В: Какво представлява азбучният ред?


О: Азбучният ред е начин за сортиране (организиране) на списък, като се следва стандартният (обичайният) ред на буквите в азбуката.

В: Кога е използван за първи път?


О: Азбучният ред е използван за първи път по време на ранната Римска империя и става обичаен след Ренесанса.

В: Как се прави сортиране в английския език?


О: Сортирането на нещата в английския език се извършва с помощта на римската азбука.

В: Има ли различни правила за сортиране в зависимост от езика?


О: Да, различните езици имат различни правила за сортиране.

В: Как числата се сортират по различен начин от думите или символите?


О: Има различни начини за сортиране на числата и специалните символи, като например букви с диакритични знаци.

В: Как немскоговорящите третират буквите с диакритични знаци при сортиране?


О: Немскоговорящите могат или да третират буквата с диакритични знаци по същия начин като тази без тях (познато като DIN 5007-1, обикновено се използва за енциклопедии), или да ги заменят с някакъв друг знак (познато като DIN 5007-2, използва се за телефонни указатели).

Въпрос: Това правило важи ли за всички езици, които използват диакритични знаци? О: Не, това правило може да се различава в зависимост от езика; датският език също има буква ن, но я подрежда след z и не я третира като a, както в немския.

AlegsaOnline.com - 2020 / 2025 - License CC3