ISO 639 е набор от международни стандарти, в които са изброени кратки кодове за имена на езици. Първоначално съществуваше ISO 639-1, който съдържа двубуквени кодове за най-често използваните езици. За да бъдат изброени много повече езици и варианти, е създаден ISO 639-2 — списък от трибуквени кодове. По-късните версии и допълнения включват ISO 639-3 (по-детайлен списък с индивидуални езици) и ISO 639-5 (кодове за езикови групи и семейства).
Всеки език в ISO 639-2 има трибуквен код. По-долу е центриран списък с буквите, който служи като съдържание и връзка към съответните секции в пъления списък. След това следват обяснения и важна допълнителна информация за самия стандарт и за начина, по който се използват кодовете.
Съдържание
- A
- B
- C
- D
- E
- F
- G
- H
- I
- J
- K
- L
- M
- N
- O
- P
- Q
- R
- S
- T
- U
- V
- W
- X
- Y
- Z
Какво представлява ISO 639-2?
ISO 639-2 е част от серията стандарти ISO 639 и съдържа трибуквени (трите знака) кодове за езици. Този формат улеснява представянето на много повече езици, диалекти и колективни наименования, отколкото двубуквените кодове в ISO 639-1. ISO 639-2 често се използва в библиотечните каталози, метаданни за документи, софтуер за локализация и при форматиране на езикови тагове.
Типове кодове в ISO 639-2: B и T
За някои езици в ISO 639-2 съществуват две различни трибуквени обозначения:
- ISO 639-2/B (bibliographic) — библиотечни кодове, традиционно използвани в каталозите и наследени от библиотечните практики.
- ISO 639-2/T (terminologic) — терминологични кодове, основаващи се по-често на автохтонното (местно) название на езика.
Примерно, за френски език има двойка кодове: fre (B) и fra (T). За някои езици има само един код (няма разделение B/T) — например английският е обозначен с eng.
Специални и резервирани кодове
ISO 639-2 включва и някои специални кодове, които не представляват отделен език в тесен смисъл, но са полезни в метаданни и описания:
- mul — multiple (няколко езика)
- und — undetermined (езикът не е определен)
- zxx — no linguistic content (без лингвистично съдържание)
- mis — uncoded languages (езици, за които няма код)
Има и диапазон от кодове, запазен за локална употреба: qaa–qtz (може да се използва за вътрешни/локални нужди, но не е официална част от стандарта за обмен на данни).
Отношение към ISO 639-1, ISO 639-3 и ISO 639-5
Когато за даден език съществува двубуквен код в ISO 639-1, той обикновено има и съответния трибуквен код в ISO 639-2 (например en → eng). ISO 639-3 разширява обхвата, като включва много по-малко разпространени и по-детайлно разграничени индивидуални езици. ISO 639-5 дефинира кодове за езикови групи и семейства (например индоевропейски езици и т.н.).
Кой поддържа и публикува списъка?
Официалният списък и поддръжката на ISO 639-2 се координират от Международната организация по стандартизация (ISO), а Регистрационният орган (Registration Authority) за ISO 639-2 е Library of Congress (Библиотеката на Конгреса на САЩ). Актуализации и промени се публикуват от съответните органи; за автоматична обработка и интеграция е препоръчително да се използват официални източници.
Практически приложения
ISO 639-2 се използва широко в:
- библиографски записи и библиотечни каталози;
- формати за метаданни (напр. MARC, Dublin Core);
- уеб и софтуерни системи за локализация и управление на съдържание;
- междуформатни езикови тагове (напр. IETF language tags, където често се комбинират с региони и варианти).
Примери за кодове
Няколко често срещани примера:
- eng — английски
- fra / fre — френски (T/B примери)
- deu / ger — немски (T/B примери)
- spa — испански
- zho / chi — китайски (някои езици също имат алтернативни форми)
За пълен и актуален списък на всички трибуквени кодове вижте официалните регистри (линкове по-долу).
Къде да намерите официалния списък
Официалният и актуализиран списък може да се намери чрез сайта на ISO и в регистрите поддържани от Library of Congress. За технически приложения е добре да се използват машинно четими формати (CSV, XML или JSON), когато са налични.
По-долу следва пълен списък на кодовете в ISO 639-2 (подреден по азбучен ред). Използвайте съдържанието в началото за бързо навигиране към секциите по букви.