Locales

Locales et chaînes de locale

Vue d’ensemble

Cette page explique la norme utilisée par General Translation pour représenter les locales et les langues, ainsi que la liste des locales actuellement prises en charge.


Chaînes de locale

General Translation utilise une variante du standard des balises de langue BCP 47 pour représenter les locales et les langues. Les balises de langue BCP 47 constituent la norme Internet Best Current Practices (BCP) pour identifier les langues, à l’oral comme à l’écrit. Ces balises offrent un moyen uniforme de spécifier les langues, permettant aux applications d’adapter le contenu, le format et le comportement en fonction de la locale de l’utilisateur.

Les balises de langue sont composées d’un ou plusieurs sous-tags séparés par le caractère "-". Les sous-tags incluent les composants suivants :

  • Sous-tag de langue : représente la langue principale, p. ex. en pour l’anglais, es pour l’espagnol.
  • Sous-tag de région : spécifie un pays ou une région, p. ex. US pour les États‑Unis, FR pour la France.
  • Sous-tag d’écriture (optionnel) : indique le système d’écriture, p. ex. Latn pour l’alphabet latin.
  • Sous-tag de variante (optionnel) : identifie une variation spécifique d’une langue, p. ex. arevela pour l’arménien oriental.

Lorsque ces balises sont combinées, on parle d’une locale ou d’une balise de locale.

Étiquettes couramment utilisées

En pratique, la plupart des étiquettes de langue se composent de deux sous‑étiquettes : une langue et une région. Voici quelques exemples courants :

Étiquette de langueDescription
en-USAnglais tel qu’utilisé aux États‑Unis
es-ESEspagnol tel qu’utilisé en Espagne
fr-CAFrançais tel qu’utilisé au Canada
zh-CNChinois simplifié (Chine)
de-DEAllemand tel qu’utilisé en Allemagne

Étiquettes étendues

Les étiquettes de langue peuvent inclure des sous‑étiquettes supplémentaires pour davantage de précision :

  • Exemple : hy-Latn-IT-arevela
    • hy : arménien (langue)
    • Latn : latin (écriture)
    • IT : Italie (région)
    • arevela : arménien oriental (variante)

Cette étiquette représente l’arménien oriental écrit en alphabet latin, tel qu’employé en Italie.

Exceptions à BCP 47 dans GT

🚧 Cette section est en cours de rédaction. 🚧


Locales prises en charge

Cette section répertorie toutes les locales actuellement prises en charge par General Translation.

Remarque sur les langues à faibles ressources

Notre système s’appuie sur certains des modèles de LLM les plus avancés du marché pour fournir des traductions précises ; cependant, ces modèles ont leurs limites. Certaines langues à faibles ressources peuvent ne pas être prises en charge par le fournisseur de modèle que vous avez sélectionné, ni par aucun des fournisseurs disponibles. Ces langues sont dites « à faibles ressources ».

La liste des langues à faibles ressources varie selon les modèles. Ainsi, si vous définissez un fournisseur de modèle préféré dans votre configuration, pensez à vérifier la liste des langues prises en charge par ce fournisseur.

Liste officielle

  • af🇿🇦
    afrikaans
  • am🇪🇹
    amharique
  • ar🇪🇬
    arabe
  • ar-AE🇦🇪
    arabe (Émirats arabes unis)
  • ar-EG🇪🇬
    arabe (Égypte)
  • ar-LB🇱🇧
    arabe (Liban)
  • ar-MA🇲🇦
    arabe (Maroc)
  • ar-SA🇸🇦
    arabe (Arabie saoudite)
  • bg🇧🇬
    bulgare
  • bn🇧🇩
    bengali
  • bs🇧🇦
    bosniaque
  • ca🌍
    catalan
  • cs🇨🇿
    tchèque
  • cy🏴󠁧󠁢󠁷󠁬󠁳󠁿
    gallois
  • da🇩🇰
    danois
  • de🇩🇪
    allemand
  • de-AT🇦🇹
    allemand autrichien
  • de-CH🇨🇭
    allemand suisse
  • de-DE🇩🇪
    allemand (Allemagne)
  • el🇬🇷
    grec
  • el-CY🇨🇾
    grec (Chypre)
  • el-EL🌍
    grec (EL)
  • en🇺🇸
    anglais
  • en-AU🇦🇺
    anglais australien
  • en-CA🇨🇦
    anglais canadien
  • en-GB🇬🇧
    anglais britannique
  • en-NZ🇳🇿
    anglais (Nouvelle-Zélande)
  • en-US🇺🇸
    anglais américain
  • es🇪🇸
    espagnol
  • es-419🌍
    espagnol d’Amérique latine
  • es-AR🇦🇷
    espagnol (Argentine)
  • es-CL🇨🇱
    espagnol (Chili)
  • es-CO🇨🇴
    espagnol (Colombie)
  • es-ES🇪🇸
    espagnol d’Espagne
  • es-MX🇲🇽
    espagnol du Mexique
  • es-PE🇵🇪
    espagnol (Pérou)
  • es-US🇺🇸
    espagnol (États-Unis)
  • es-VE🇻🇪
    espagnol (Venezuela)
  • et🇪🇪
    estonien
  • fa🇮🇷
    persan
  • fi🇫🇮
    finnois
  • fil🇵🇭
    filipino
  • fr🇫🇷
    français
  • fr-BE🇧🇪
    français (Belgique)
  • fr-CA🇨🇦
    français canadien
  • fr-CH🇨🇭
    français suisse
  • fr-CM🇨🇲
    français (Cameroun)
  • fr-FR🇫🇷
    français (France)
  • fr-SN🇸🇳
    français (Sénégal)
  • gu🇮🇳
    goudjarati
  • he🇮🇱
    hébreu
  • hi🇮🇳
    hindi
  • hr🇭🇷
    croate
  • hu🇭🇺
    hongrois
  • hy🇦🇲
    arménien
  • id🇮🇩
    indonésien
  • is🇮🇸
    islandais
  • it🇮🇹
    italien
  • it-CH🇨🇭
    italien (Suisse)
  • it-IT🇮🇹
    italien (Italie)
  • ja🇯🇵
    japonais
  • ka🇬🇪
    géorgien
  • kk🇰🇿
    kazakh
  • kn🇮🇳
    kannada
  • ko🇰🇷
    coréen
  • la🇻🇦
    latin
  • lt🇱🇹
    lituanien
  • lv🇱🇻
    letton
  • mk🇲🇰
    macédonien
  • ml🇮🇳
    malayalam
  • mn🇲🇳
    mongol
  • mr🇮🇳
    marathi
  • ms🇲🇾
    malais
  • my🇲🇲
    birman
  • nl🇳🇱
    néerlandais
  • nl-BE🇧🇪
    flamand
  • nl-NL🇳🇱
    néerlandais (Pays-Bas)
  • no🇳🇴
    norvégien
  • pa🇮🇳
    pendjabi
  • pl🇵🇱
    polonais
  • pt🇧🇷
    portugais
  • pt-BR🇧🇷
    portugais brésilien
  • pt-PT🇵🇹
    portugais européen
  • qbr🌍
    qbr
  • ro🇷🇴
    roumain
  • ru🇷🇺
    russe
  • sk🇸🇰
    slovaque
  • sl🇸🇮
    slovène
  • so🇸🇴
    somali
  • sq🇦🇱
    albanais
  • sr🇷🇸
    serbe
  • sv🇸🇪
    suédois
  • sw🇹🇿
    swahili
  • sw-KE🇰🇪
    swahili (Kenya)
  • sw-TZ🇹🇿
    swahili (Tanzanie)
  • ta🇮🇳
    tamoul
  • te🇮🇳
    télougou
  • th🇹🇭
    thaï
  • tl🇵🇭
    filipino
  • tr🇹🇷
    turc
  • uk🇺🇦
    ukrainien
  • ur🇵🇰
    ourdou
  • vi🇻🇳
    vietnamien
  • zh🇨🇳
    chinois
  • zh-CN🇨🇳
    chinois (Chine)
  • zh-HK🇭🇰
    chinois (R.A.S. chinoise de Hong Kong)
  • zh-Hans🇨🇳
    chinois simplifié
  • zh-Hant🇹🇼
    chinois traditionnel
  • zh-SG🇸🇬
    chinois (Singapour)
  • zh-TW🇹🇼
    chinois (Taïwan)

Notes

  • General Translation utilise des balises de locale (locales) pour identifier en interne les langues et les régions.

Prochaines étapes

Comment trouvez-vous ce guide ?