Локали
Локали и строковые коды локалей
Обзор
На этой странице описаны стандарт, используемый General Translation для представления локалей и языков, и список поддерживаемых в настоящее время локалей.
Строки локалей
General Translation использует вариант стандарта BCP 47 Language Tag для представления локалей и языков. Языковые теги BCP 47 — это стандарт Internet Best Current Practices (BCP) для идентификации языков как в устной, так и в письменной форме. Эти теги обеспечивают единообразный способ указания языка, позволяя приложениям адаптировать содержимое, формат и поведение в зависимости от локали пользователя.
Языковые теги состоят из одного или нескольких подтегов, разделённых символом "-". Подтеги включают следующие компоненты:
- Language Subtag: обозначает основной язык, например
en— английский,es— испанский. - Region Subtag: указывает страну или регион, например
US— США,FR— Франция. - Script Subtag (optional): указывает систему письма, например
Latn— латиница. - Variant Subtag (optional): обозначает конкретный вариант языка, например
arevela— восточноармянский.
Когда эти теги объединяются, это называется Locale или Locale tag.
Часто используемые теги
На практике большинство языковых тегов состоят из двух подпараметров: язык и регион. Ниже приведены распространенные примеры:
| Языковой тег | Описание |
|---|---|
en-US | Английский (США) |
es-ES | Испанский (Испания) |
fr-CA | Французский (Канада) |
zh-CN | Упрощенный китайский (Китай) |
de-DE | Немецкий (Германия) |
Расширенные теги
Языковые теги могут включать дополнительные подподы (субтеги) для большей точности:
- Пример:
hy-Latn-IT-arevelahy: армянский (язык)Latn: латиница (письмо)IT: Италия (регион)arevela: восточноармянский (вариант)
Этот тег обозначает восточноармянский, записанный латиницей, как он используется в Италии.
Исключения из BCP 47 в GT
🚧 Этот раздел находится в разработке. 🚧
Поддерживаемые локали
В этом разделе перечислены все локали, которые сейчас поддерживаются General Translation.
Примечание о малоресурсных языках
Наша система использует одни из самых продвинутых LLM‑моделей на рынке для обеспечения точных переводов; однако у этих моделей есть ограничения. Некоторые языки могут не поддерживаться выбранным вами провайдером моделей или кем‑либо из доступных провайдеров. Такие языки называют «малоресурсными».
Перечень малоресурсных языков различается у разных моделей, поэтому, если вы указываете предпочитаемого провайдера моделей в конфигурации, рекомендуем проверить список поддерживаемых им языков.
Официальный список
- af🇿🇦африкаанс
- am🇪🇹амхарский
- ar🇪🇬арабский
- ar-AE🇦🇪арабский (ОАЭ)
- ar-EG🇪🇬арабский (Египет)
- ar-LB🇱🇧арабский (Ливан)
- ar-MA🇲🇦арабский (Марокко)
- ar-SA🇸🇦арабский (Саудовская Аравия)
- bg🇧🇬болгарский
- bn🇧🇩бенгальский
- bs🇧🇦боснийский
- ca🌍каталанский
- cs🇨🇿чешский
- cy🏴валлийский
- da🇩🇰датский
- de🇩🇪немецкий
- de-AT🇦🇹австрийский немецкий
- de-CH🇨🇭литературный швейцарский немецкий
- de-DE🇩🇪немецкий (Германия)
- el🇬🇷греческий
- el-CY🇨🇾греческий (Кипр)
- el-EL🌍греческий (EL)
- en🇺🇸английский
- en-AU🇦🇺австралийский английский
- en-CA🇨🇦канадский английский
- en-GB🇬🇧британский английский
- en-NZ🇳🇿английский (Новая Зеландия)
- en-US🇺🇸американский английский
- es🇪🇸испанский
- es-419🌍латиноамериканский испанский
- es-AR🇦🇷испанский (Аргентина)
- es-CL🇨🇱испанский (Чили)
- es-CO🇨🇴испанский (Колумбия)
- es-ES🇪🇸европейский испанский
- es-MX🇲🇽мексиканский испанский
- es-PE🇵🇪испанский (Перу)
- es-US🇺🇸испанский (Соединенные Штаты)
- es-VE🇻🇪испанский (Венесуэла)
- et🇪🇪эстонский
- fa🇮🇷персидский
- fi🇫🇮финский
- fil🇵🇭филиппинский
- fr🇫🇷французский
- fr-BE🇧🇪французский (Бельгия)
- fr-CA🇨🇦канадский французский
- fr-CH🇨🇭швейцарский французский
- fr-CM🇨🇲французский (Камерун)
- fr-FR🇫🇷французский (Франция)
- fr-SN🇸🇳французский (Сенегал)
- gu🇮🇳гуджарати
- he🇮🇱иврит
- hi🇮🇳хинди
- hr🇭🇷хорватский
- hu🇭🇺венгерский
- hy🇦🇲армянский
- id🇮🇩индонезийский
- is🇮🇸исландский
- it🇮🇹итальянский
- it-CH🇨🇭итальянский (Швейцария)
- it-IT🇮🇹итальянский (Италия)
- ja🇯🇵японский
- ka🇬🇪грузинский
- kk🇰🇿казахский
- kn🇮🇳каннада
- ko🇰🇷корейский
- la🇻🇦латинский
- lt🇱🇹литовский
- lv🇱🇻латышский
- mk🇲🇰македонский
- ml🇮🇳малаялам
- mn🇲🇳монгольский
- mr🇮🇳маратхи
- ms🇲🇾малайский
- my🇲🇲бирманский
- nl🇳🇱нидерландский
- nl-BE🇧🇪фламандский
- nl-NL🇳🇱нидерландский (Нидерланды)
- no🇳🇴норвежский
- pa🇮🇳панджаби
- pl🇵🇱польский
- pt🇧🇷португальский
- pt-BR🇧🇷бразильский португальский
- pt-PT🇵🇹европейский португальский
- qbr🌍qbr
- ro🇷🇴румынский
- ru🇷🇺русский
- sk🇸🇰словацкий
- sl🇸🇮словенский
- so🇸🇴сомали
- sq🇦🇱албанский
- sr🇷🇸сербский
- sv🇸🇪шведский
- sw🇹🇿суахили
- sw-KE🇰🇪суахили (Кения)
- sw-TZ🇹🇿суахили (Танзания)
- ta🇮🇳тамильский
- te🇮🇳телугу
- th🇹🇭тайский
- tl🇵🇭филиппинский
- tr🇹🇷турецкий
- uk🇺🇦украинский
- ur🇵🇰урду
- vi🇻🇳вьетнамский
- zh🇨🇳китайский
- zh-CN🇨🇳китайский (Китай)
- zh-HK🇭🇰китайский (Гонконг [САР])
- zh-Hans🇨🇳китайский, упрощенное письмо
- zh-Hant🇹🇼китайский, традиционное письмо
- zh-SG🇸🇬китайский (Сингапур)
- zh-TW🇹🇼китайский (Тайвань)
Примечания
- General Translation использует теги локали (Locales) для внутреннего обозначения языков и регионов.
Дальнейшие шаги
- Ознакомьтесь со списком поддерживаемых локалей, чтобы найти языковые теги, доступные в General Translation.
- Обратитесь к официальному реестру языковых тегов IETF и к стандарту BCP 47 для языковых тегов для получения дополнительной информации.
Насколько полезно это руководство?