Locales
Locales et chaînes de locale
Vue d’ensemble
Cette page explique la norme utilisée par General Translation pour représenter les locales et les langues, ainsi que la liste des locales actuellement prises en charge.
Chaînes de locale
General Translation utilise une variante du standard des balises de langue BCP 47 pour représenter les locales et les langues. Les balises de langue BCP 47 constituent la norme Internet Best Current Practices (BCP) pour identifier les langues, à l’oral comme à l’écrit. Ces balises offrent un moyen uniforme de spécifier les langues, permettant aux applications d’adapter le contenu, le format et le comportement en fonction de la locale de l’utilisateur.
Les balises de langue sont composées d’un ou plusieurs sous-tags séparés par le caractère "-". Les sous-tags incluent les composants suivants :
- Sous-tag de langue : représente la langue principale, p. ex.
enpour l’anglais,espour l’espagnol. - Sous-tag de région : spécifie un pays ou une région, p. ex.
USpour les États‑Unis,FRpour la France. - Sous-tag d’écriture (optionnel) : indique le système d’écriture, p. ex.
Latnpour l’alphabet latin. - Sous-tag de variante (optionnel) : identifie une variation spécifique d’une langue, p. ex.
arevelapour l’arménien oriental.
Lorsque ces balises sont combinées, on parle d’une locale ou d’une balise de locale.
Étiquettes couramment utilisées
En pratique, la plupart des étiquettes de langue se composent de deux sous‑étiquettes : une langue et une région. Voici quelques exemples courants :
| Étiquette de langue | Description |
|---|---|
en-US | Anglais tel qu’utilisé aux États‑Unis |
es-ES | Espagnol tel qu’utilisé en Espagne |
fr-CA | Français tel qu’utilisé au Canada |
zh-CN | Chinois simplifié (Chine) |
de-DE | Allemand tel qu’utilisé en Allemagne |
Étiquettes étendues
Les étiquettes de langue peuvent inclure des sous‑étiquettes supplémentaires pour davantage de précision :
- Exemple :
hy-Latn-IT-arevelahy: arménien (langue)Latn: latin (écriture)IT: Italie (région)arevela: arménien oriental (variante)
Cette étiquette représente l’arménien oriental écrit en alphabet latin, tel qu’employé en Italie.
Exceptions à BCP 47 dans GT
🚧 Cette section est en cours de rédaction. 🚧
Locales prises en charge
Cette section répertorie toutes les locales actuellement prises en charge par General Translation.
Remarque sur les langues à faibles ressources
Notre système s’appuie sur certains des modèles de LLM les plus avancés du marché pour fournir des traductions précises ; cependant, ces modèles ont leurs limites. Certaines langues à faibles ressources peuvent ne pas être prises en charge par le fournisseur de modèle que vous avez sélectionné, ni par aucun des fournisseurs disponibles. Ces langues sont dites « à faibles ressources ».
La liste des langues à faibles ressources varie selon les modèles. Ainsi, si vous définissez un fournisseur de modèle préféré dans votre configuration, pensez à vérifier la liste des langues prises en charge par ce fournisseur.
Liste officielle
- af🇿🇦afrikaans
- am🇪🇹amharique
- ar🇪🇬arabe
- ar-AE🇦🇪arabe (Émirats arabes unis)
- ar-EG🇪🇬arabe (Égypte)
- ar-LB🇱🇧arabe (Liban)
- ar-MA🇲🇦arabe (Maroc)
- ar-SA🇸🇦arabe (Arabie saoudite)
- bg🇧🇬bulgare
- bn🇧🇩bengali
- bs🇧🇦bosniaque
- ca🌍catalan
- cs🇨🇿tchèque
- cy🏴gallois
- da🇩🇰danois
- de🇩🇪allemand
- de-AT🇦🇹allemand autrichien
- de-CH🇨🇭allemand suisse
- de-DE🇩🇪allemand (Allemagne)
- el🇬🇷grec
- el-CY🇨🇾grec (Chypre)
- el-EL🌍grec (EL)
- en🇺🇸anglais
- en-AU🇦🇺anglais australien
- en-CA🇨🇦anglais canadien
- en-GB🇬🇧anglais britannique
- en-NZ🇳🇿anglais (Nouvelle-Zélande)
- en-US🇺🇸anglais américain
- es🇪🇸espagnol
- es-419🌍espagnol d’Amérique latine
- es-AR🇦🇷espagnol (Argentine)
- es-CL🇨🇱espagnol (Chili)
- es-CO🇨🇴espagnol (Colombie)
- es-ES🇪🇸espagnol d’Espagne
- es-MX🇲🇽espagnol du Mexique
- es-PE🇵🇪espagnol (Pérou)
- es-US🇺🇸espagnol (États-Unis)
- es-VE🇻🇪espagnol (Venezuela)
- et🇪🇪estonien
- fa🇮🇷persan
- fi🇫🇮finnois
- fil🇵🇭filipino
- fr🇫🇷français
- fr-BE🇧🇪français (Belgique)
- fr-CA🇨🇦français canadien
- fr-CH🇨🇭français suisse
- fr-CM🇨🇲français (Cameroun)
- fr-FR🇫🇷français (France)
- fr-SN🇸🇳français (Sénégal)
- gu🇮🇳goudjarati
- he🇮🇱hébreu
- hi🇮🇳hindi
- hr🇭🇷croate
- hu🇭🇺hongrois
- hy🇦🇲arménien
- id🇮🇩indonésien
- is🇮🇸islandais
- it🇮🇹italien
- it-CH🇨🇭italien (Suisse)
- it-IT🇮🇹italien (Italie)
- ja🇯🇵japonais
- ka🇬🇪géorgien
- kk🇰🇿kazakh
- kn🇮🇳kannada
- ko🇰🇷coréen
- la🇻🇦latin
- lt🇱🇹lituanien
- lv🇱🇻letton
- mk🇲🇰macédonien
- ml🇮🇳malayalam
- mn🇲🇳mongol
- mr🇮🇳marathi
- ms🇲🇾malais
- my🇲🇲birman
- nl🇳🇱néerlandais
- nl-BE🇧🇪flamand
- nl-NL🇳🇱néerlandais (Pays-Bas)
- no🇳🇴norvégien
- pa🇮🇳pendjabi
- pl🇵🇱polonais
- pt🇧🇷portugais
- pt-BR🇧🇷portugais brésilien
- pt-PT🇵🇹portugais européen
- qbr🌍qbr
- ro🇷🇴roumain
- ru🇷🇺russe
- sk🇸🇰slovaque
- sl🇸🇮slovène
- so🇸🇴somali
- sq🇦🇱albanais
- sr🇷🇸serbe
- sv🇸🇪suédois
- sw🇹🇿swahili
- sw-KE🇰🇪swahili (Kenya)
- sw-TZ🇹🇿swahili (Tanzanie)
- ta🇮🇳tamoul
- te🇮🇳télougou
- th🇹🇭thaï
- tl🇵🇭filipino
- tr🇹🇷turc
- uk🇺🇦ukrainien
- ur🇵🇰ourdou
- vi🇻🇳vietnamien
- zh🇨🇳chinois
- zh-CN🇨🇳chinois (Chine)
- zh-HK🇭🇰chinois (R.A.S. chinoise de Hong Kong)
- zh-Hans🇨🇳chinois simplifié
- zh-Hant🇹🇼chinois traditionnel
- zh-SG🇸🇬chinois (Singapour)
- zh-TW🇹🇼chinois (Taïwan)
Notes
- General Translation utilise des balises de locale (locales) pour identifier en interne les langues et les régions.
Prochaines étapes
- Consultez notre liste des locales prises en charge pour découvrir les balises de langue disponibles dans General Translation.
- Reportez-vous au registre officiel des balises de langue de l’IETF et à la spécification des balises de langue BCP 47 pour en savoir plus.
Comment trouvez-vous ce guide ?