Локали

Локали и строковые коды локалей

Обзор

На этой странице описаны стандарт, используемый General Translation для представления локалей и языков, и список поддерживаемых в настоящее время локалей.


Строки локалей

General Translation использует вариант стандарта BCP 47 Language Tag для представления локалей и языков. Языковые теги BCP 47 — это стандарт Internet Best Current Practices (BCP) для идентификации языков как в устной, так и в письменной форме. Эти теги обеспечивают единообразный способ указания языка, позволяя приложениям адаптировать содержимое, формат и поведение в зависимости от локали пользователя.

Языковые теги состоят из одного или нескольких подтегов, разделённых символом "-". Подтеги включают следующие компоненты:

  • Language Subtag: обозначает основной язык, например en — английский, es — испанский.
  • Region Subtag: указывает страну или регион, например US — США, FR — Франция.
  • Script Subtag (optional): указывает систему письма, например Latn — латиница.
  • Variant Subtag (optional): обозначает конкретный вариант языка, например arevela — восточноармянский.

Когда эти теги объединяются, это называется Locale или Locale tag.

Часто используемые теги

На практике большинство языковых тегов состоят из двух подпараметров: язык и регион. Ниже приведены распространенные примеры:

Языковой тегОписание
en-USАнглийский (США)
es-ESИспанский (Испания)
fr-CAФранцузский (Канада)
zh-CNУпрощенный китайский (Китай)
de-DEНемецкий (Германия)

Расширенные теги

Языковые теги могут включать дополнительные подподы (субтеги) для большей точности:

  • Пример: hy-Latn-IT-arevela
    • hy: армянский (язык)
    • Latn: латиница (письмо)
    • IT: Италия (регион)
    • arevela: восточноармянский (вариант)

Этот тег обозначает восточноармянский, записанный латиницей, как он используется в Италии.

Исключения из BCP 47 в GT

🚧 Этот раздел находится в разработке. 🚧


Поддерживаемые локали

В этом разделе перечислены все локали, которые сейчас поддерживаются General Translation.

Примечание о малоресурсных языках

Наша система использует одни из самых продвинутых LLM‑моделей на рынке для обеспечения точных переводов; однако у этих моделей есть ограничения. Некоторые языки могут не поддерживаться выбранным вами провайдером моделей или кем‑либо из доступных провайдеров. Такие языки называют «малоресурсными».

Перечень малоресурсных языков различается у разных моделей, поэтому, если вы указываете предпочитаемого провайдера моделей в конфигурации, рекомендуем проверить список поддерживаемых им языков.

Официальный список

  • af🇿🇦
    африкаанс
  • am🇪🇹
    амхарский
  • ar🇪🇬
    арабский
  • ar-AE🇦🇪
    арабский (ОАЭ)
  • ar-EG🇪🇬
    арабский (Египет)
  • ar-LB🇱🇧
    арабский (Ливан)
  • ar-MA🇲🇦
    арабский (Марокко)
  • ar-SA🇸🇦
    арабский (Саудовская Аравия)
  • bg🇧🇬
    болгарский
  • bn🇧🇩
    бенгальский
  • bs🇧🇦
    боснийский
  • ca🌍
    каталанский
  • cs🇨🇿
    чешский
  • cy🏴󠁧󠁢󠁷󠁬󠁳󠁿
    валлийский
  • da🇩🇰
    датский
  • de🇩🇪
    немецкий
  • de-AT🇦🇹
    австрийский немецкий
  • de-CH🇨🇭
    литературный швейцарский немецкий
  • de-DE🇩🇪
    немецкий (Германия)
  • el🇬🇷
    греческий
  • el-CY🇨🇾
    греческий (Кипр)
  • el-EL🌍
    греческий (EL)
  • en🇺🇸
    английский
  • en-AU🇦🇺
    австралийский английский
  • en-CA🇨🇦
    канадский английский
  • en-GB🇬🇧
    британский английский
  • en-NZ🇳🇿
    английский (Новая Зеландия)
  • en-US🇺🇸
    американский английский
  • es🇪🇸
    испанский
  • es-419🌍
    латиноамериканский испанский
  • es-AR🇦🇷
    испанский (Аргентина)
  • es-CL🇨🇱
    испанский (Чили)
  • es-CO🇨🇴
    испанский (Колумбия)
  • es-ES🇪🇸
    европейский испанский
  • es-MX🇲🇽
    мексиканский испанский
  • es-PE🇵🇪
    испанский (Перу)
  • es-US🇺🇸
    испанский (Соединенные Штаты)
  • es-VE🇻🇪
    испанский (Венесуэла)
  • et🇪🇪
    эстонский
  • fa🇮🇷
    персидский
  • fi🇫🇮
    финский
  • fil🇵🇭
    филиппинский
  • fr🇫🇷
    французский
  • fr-BE🇧🇪
    французский (Бельгия)
  • fr-CA🇨🇦
    канадский французский
  • fr-CH🇨🇭
    швейцарский французский
  • fr-CM🇨🇲
    французский (Камерун)
  • fr-FR🇫🇷
    французский (Франция)
  • fr-SN🇸🇳
    французский (Сенегал)
  • gu🇮🇳
    гуджарати
  • he🇮🇱
    иврит
  • hi🇮🇳
    хинди
  • hr🇭🇷
    хорватский
  • hu🇭🇺
    венгерский
  • hy🇦🇲
    армянский
  • id🇮🇩
    индонезийский
  • is🇮🇸
    исландский
  • it🇮🇹
    итальянский
  • it-CH🇨🇭
    итальянский (Швейцария)
  • it-IT🇮🇹
    итальянский (Италия)
  • ja🇯🇵
    японский
  • ka🇬🇪
    грузинский
  • kk🇰🇿
    казахский
  • kn🇮🇳
    каннада
  • ko🇰🇷
    корейский
  • la🇻🇦
    латинский
  • lt🇱🇹
    литовский
  • lv🇱🇻
    латышский
  • mk🇲🇰
    македонский
  • ml🇮🇳
    малаялам
  • mn🇲🇳
    монгольский
  • mr🇮🇳
    маратхи
  • ms🇲🇾
    малайский
  • my🇲🇲
    бирманский
  • nl🇳🇱
    нидерландский
  • nl-BE🇧🇪
    фламандский
  • nl-NL🇳🇱
    нидерландский (Нидерланды)
  • no🇳🇴
    норвежский
  • pa🇮🇳
    панджаби
  • pl🇵🇱
    польский
  • pt🇧🇷
    португальский
  • pt-BR🇧🇷
    бразильский португальский
  • pt-PT🇵🇹
    европейский португальский
  • qbr🌍
    qbr
  • ro🇷🇴
    румынский
  • ru🇷🇺
    русский
  • sk🇸🇰
    словацкий
  • sl🇸🇮
    словенский
  • so🇸🇴
    сомали
  • sq🇦🇱
    албанский
  • sr🇷🇸
    сербский
  • sv🇸🇪
    шведский
  • sw🇹🇿
    суахили
  • sw-KE🇰🇪
    суахили (Кения)
  • sw-TZ🇹🇿
    суахили (Танзания)
  • ta🇮🇳
    тамильский
  • te🇮🇳
    телугу
  • th🇹🇭
    тайский
  • tl🇵🇭
    филиппинский
  • tr🇹🇷
    турецкий
  • uk🇺🇦
    украинский
  • ur🇵🇰
    урду
  • vi🇻🇳
    вьетнамский
  • zh🇨🇳
    китайский
  • zh-CN🇨🇳
    китайский (Китай)
  • zh-HK🇭🇰
    китайский (Гонконг [САР])
  • zh-Hans🇨🇳
    китайский, упрощенное письмо
  • zh-Hant🇹🇼
    китайский, традиционное письмо
  • zh-SG🇸🇬
    китайский (Сингапур)
  • zh-TW🇹🇼
    китайский (Тайвань)

Примечания

  • General Translation использует теги локали (Locales) для внутреннего обозначения языков и регионов.

Дальнейшие шаги

Насколько полезно это руководство?

Локали