Locales

Locales et chaînes de locales

Présentation

Cette page explique la norme utilisée par General Translation pour représenter les locales et les langues, ainsi que la liste des locales actuellement prises en charge.


Chaînes de locale

General Translation utilise une variante de la norme BCP 47 d’étiquetage des langues pour représenter les locales et les langues. Les étiquettes BCP 47 constituent la recommandation BCP (Best Current Practices) sur Internet pour identifier les langues, à l’oral comme à l’écrit. Elles offrent un moyen uniforme de spécifier les langues, permettant aux applications d’adapter le contenu, le formatage et le comportement en fonction de la locale de l’utilisateur.

Les étiquettes de langue sont composées d’un ou plusieurs sous-tags séparés par le caractère "-". Les sous-tags incluent les composants suivants :

  • Sous-tag de langue : représente la langue principale, p. ex., en pour l’anglais, es pour l’espagnol.
  • Sous-tag de région : spécifie un pays ou une région, p. ex., US pour les États‑Unis, FR pour la France.
  • Sous-tag d’écriture (optionnel) : indique le système d’écriture, p. ex., Latn pour l’alphabet latin.
  • Sous-tag de variante (optionnel) : identifie une variante spécifique d’une langue, p. ex., arevela pour l’arménien oriental.

Lorsque vous combinez ces tags, on parle d’une locale ou d’une étiquette de locale.

Balises courantes

En pratique, la plupart des balises de langue se composent de deux sous‑balises : une langue et une région. Voici quelques exemples courants :

Balise de langueDescription
en-USAnglais tel qu’employé aux États‑Unis
es-ESEspagnol tel qu’employé en Espagne
fr-CAFrançais tel qu’employé au Canada
zh-CNChinois simplifié (Chine)
de-DEAllemand tel qu’employé en Allemagne

Étiquettes étendues

Les étiquettes de langue peuvent inclure des sous-étiquettes supplémentaires pour plus de précision :

  • Exemple : hy-Latn-IT-arevela
    • hy : arménien (langue)
    • Latn : latin (écriture)
    • IT : Italie (région)
    • arevela : arménien oriental (variante)

Cette étiquette représente l’arménien oriental écrit en alphabet latin, tel qu’il est utilisé en Italie.

Exceptions à BCP 47 dans GT

🚧 Cette section est en cours de rédaction. 🚧


Langues/variantes prises en charge

Cette section répertorie toutes les locales actuellement prises en charge par General Translation.

Remarque sur les langues à faibles ressources

Notre système s’appuie sur certains des modèles LLM les plus avancés du marché pour fournir des traductions précises ; toutefois, ces modèles ont aussi leurs limites. Il se peut que certaines langues à faibles ressources ne soient pas prises en charge par le fournisseur de modèles que vous avez sélectionné ni par l’un des autres fournisseurs disponibles. Ces langues sont dites « langues à faibles ressources ».

Les langues à faibles ressources varient selon les modèles ; ainsi, si vous spécifiez un fournisseur de modèles préféré dans votre configuration, vous devriez vérifier la liste des langues prises en charge par ce fournisseur.

Liste officielle

  • af🇿🇦
    afrikaans
  • am🇪🇹
    amharique
  • ar🇪🇬
    arabe
  • ar-AE🇦🇪
    arabe (Émirats arabes unis)
  • ar-EG🇪🇬
    arabe (Égypte)
  • ar-LB🇱🇧
    arabe (Liban)
  • ar-MA🇲🇦
    arabe (Maroc)
  • ar-SA🇸🇦
    arabe (Arabie saoudite)
  • bg🇧🇬
    bulgare
  • bn🇧🇩
    bengali
  • bs🇧🇦
    bosniaque
  • ca🌍
    catalan
  • cs🇨🇿
    tchèque
  • cy🏴󠁧󠁢󠁷󠁬󠁳󠁿
    gallois
  • da🇩🇰
    danois
  • de🇩🇪
    allemand
  • de-AT🇦🇹
    allemand autrichien
  • de-CH🇨🇭
    allemand suisse
  • de-DE🇩🇪
    allemand (Allemagne)
  • el🇬🇷
    grec
  • el-CY🇨🇾
    grec (Chypre)
  • el-EL🌍
    grec (EL)
  • en🇺🇸
    anglais
  • en-AU🇦🇺
    anglais australien
  • en-CA🇨🇦
    anglais canadien
  • en-GB🇬🇧
    anglais britannique
  • en-NZ🇳🇿
    anglais (Nouvelle-Zélande)
  • en-US🇺🇸
    anglais américain
  • es🇪🇸
    espagnol
  • es-419🌍
    espagnol d’Amérique latine
  • es-AR🇦🇷
    espagnol (Argentine)
  • es-CL🇨🇱
    espagnol (Chili)
  • es-CO🇨🇴
    espagnol (Colombie)
  • es-ES🇪🇸
    espagnol d’Espagne
  • es-MX🇲🇽
    espagnol du Mexique
  • es-PE🇵🇪
    espagnol (Pérou)
  • es-US🇺🇸
    espagnol (États-Unis)
  • es-VE🇻🇪
    espagnol (Venezuela)
  • et🇪🇪
    estonien
  • fa🇮🇷
    persan
  • fi🇫🇮
    finnois
  • fil🇵🇭
    filipino
  • fr🇫🇷
    français
  • fr-BE🇧🇪
    français (Belgique)
  • fr-CA🇨🇦
    français canadien
  • fr-CH🇨🇭
    français suisse
  • fr-CM🇨🇲
    français (Cameroun)
  • fr-FR🇫🇷
    français (France)
  • fr-SN🇸🇳
    français (Sénégal)
  • gu🇮🇳
    goudjarati
  • he🇮🇱
    hébreu
  • hi🇮🇳
    hindi
  • hr🇭🇷
    croate
  • hu🇭🇺
    hongrois
  • hy🇦🇲
    arménien
  • id🇮🇩
    indonésien
  • is🇮🇸
    islandais
  • it🇮🇹
    italien
  • it-CH🇨🇭
    italien (Suisse)
  • it-IT🇮🇹
    italien (Italie)
  • ja🇯🇵
    japonais
  • ka🇬🇪
    géorgien
  • kk🇰🇿
    kazakh
  • kn🇮🇳
    kannada
  • ko🇰🇷
    coréen
  • la🇻🇦
    latin
  • lt🇱🇹
    lituanien
  • lv🇱🇻
    letton
  • mk🇲🇰
    macédonien
  • ml🇮🇳
    malayalam
  • mn🇲🇳
    mongol
  • mr🇮🇳
    marathi
  • ms🇲🇾
    malais
  • my🇲🇲
    birman
  • nl🇳🇱
    néerlandais
  • nl-BE🇧🇪
    flamand
  • nl-NL🇳🇱
    néerlandais (Pays-Bas)
  • no🇳🇴
    norvégien
  • pa🇮🇳
    pendjabi
  • pl🇵🇱
    polonais
  • pt🇧🇷
    portugais
  • pt-BR🇧🇷
    portugais brésilien
  • pt-PT🇵🇹
    portugais européen
  • qbr🌍
    qbr
  • ro🇷🇴
    roumain
  • ru🇷🇺
    russe
  • sk🇸🇰
    slovaque
  • sl🇸🇮
    slovène
  • so🇸🇴
    somali
  • sq🇦🇱
    albanais
  • sr🇷🇸
    serbe
  • sv🇸🇪
    suédois
  • sw🇹🇿
    swahili
  • sw-KE🇰🇪
    swahili (Kenya)
  • sw-TZ🇹🇿
    swahili (Tanzanie)
  • ta🇮🇳
    tamoul
  • te🇮🇳
    télougou
  • th🇹🇭
    thaï
  • tl🇵🇭
    filipino
  • tr🇹🇷
    turc
  • uk🇺🇦
    ukrainien
  • ur🇵🇰
    ourdou
  • vi🇻🇳
    vietnamien
  • zh🇨🇳
    chinois
  • zh-CN🇨🇳
    chinois (Chine)
  • zh-HK🇭🇰
    chinois (R.A.S. chinoise de Hong Kong)
  • zh-Hans🇨🇳
    chinois simplifié
  • zh-Hant🇹🇼
    chinois traditionnel
  • zh-SG🇸🇬
    chinois (Singapour)
  • zh-TW🇹🇼
    chinois (Taïwan)

Remarques

  • General Translation utilise des balises de locale (locales) pour identifier les langues et les régions en interne.

Prochaines étapes

Que pensez-vous de ce guide ?

Locales