ロケール
ロケールとロケール文字列
概要
このページでは、General Translationが使用するロケールと言語を表現するための標準と、現在サポートされているロケールのリストについて説明します。
ロケール文字列
General Translation では、ロケールや言語を表すために BCP 47 言語タグ標準 のバリアントを使用しています。 BCP 47 言語タグは、話し言葉および書き言葉の両方で言語を識別するためのインターネットのベストカレントプラクティス(BCP)標準です。 これらのタグは言語を指定するための統一的な方法を提供し、アプリケーションがユーザーのロケールに基づいてコンテンツ、フォーマット、動作を適応できるようにします。
言語タグは、"-"
文字で区切られた 1 つ以上のサブタグで構成されます。サブタグには以下の要素が含まれます:
- 言語サブタグ: 主となる言語を表します。例:
en
(英語)、es
(スペイン語)。 - 地域サブタグ: 国や地域を指定します。例:
US
(アメリカ合衆国)、FR
(フランス)。 - スクリプトサブタグ(オプション): 書記体系を示します。例:
Latn
(ラテン文字)。 - バリアントサブタグ(オプション): 言語の特定のバリエーションを識別します。例:
arevela
(東アルメニア語)。
これらのタグを組み合わせたものを ロケール または ロケールタグ と呼びます。
よく使われるタグ
実際には、ほとんどの言語タグは言語と地域の 2 つのサブタグで構成されています。以下は一般的な例です:
言語タグ | 説明 |
---|---|
en-US | アメリカで使われる英語 |
es-ES | スペインで使われるスペイン語 |
fr-CA | カナダで使われるフランス語 |
zh-CN | 簡体字中国語(中国) |
de-DE | ドイツで使われるドイツ語 |
拡張タグ
言語タグには、より詳細な指定のために追加のサブタグを含めることができます:
- 例:
hy-Latn-IT-arevela
hy
: アルメニア語(言語)Latn
: ラテン文字(スクリプト)IT
: イタリア(地域)arevela
: 東アルメニア語(バリアント)
このタグは、イタリアで使われるラテン文字表記の東アルメニア語を表します。
GTにおけるBCP 47の例外
🚧 このセクションは現在作成中です。🚧
サポートされているロケール
このセクションでは、General Translation で現在サポートされているすべてのロケールを一覧表示します。
リソースが少ない言語についての注意
当社のシステムは、市場で最も先進的な LLM モデルのいくつかを活用し、正確な翻訳を提供しています。 しかしながら、これらのモデルにも限界があります。 選択したモデルプロバイダーや利用可能なプロバイダーのいずれかによっては、特定のリソース言語がサポートされていない場合があります。 これらの言語は「リソースが少ない言語」として知られています。
リソースが少ない言語はモデルによって異なるため、設定で優先するモデルプロバイダーを指定している場合は、そのプロバイダーのサポート言語リストを確認することをおすすめします。
公式リスト
- af🇿🇦Afrikaans
- am🇪🇹Amharic
- ar🇪🇬Arabic
- ar-AE🇦🇪Arabic (United Arab Emirates)
- ar-EG🇪🇬Arabic (Egypt)
- ar-LB🇱🇧Arabic (Lebanon)
- ar-MA🇲🇦Arabic (Morocco)
- ar-SA🇸🇦Arabic (Saudi Arabia)
- bg🇧🇬Bulgarian
- bn🇧🇩Bangla
- bs🇧🇦Bosnian
- ca🌍Catalan
- cs🇨🇿Czech
- cy🏴Welsh
- da🇩🇰Danish
- de🇩🇪German
- de-AT🇦🇹Austrian German
- de-CH🇨🇭Swiss High German
- de-DE🇩🇪German (Germany)
- el🇬🇷Greek
- el-CY🇨🇾Greek (Cyprus)
- el-EL🌍Greek (EL)
- en🇺🇸English
- en-AU🇦🇺Australian English
- en-CA🇨🇦Canadian English
- en-GB🇬🇧British English
- en-NZ🇳🇿English (New Zealand)
- en-US🇺🇸American English
- es🇪🇸Spanish
- es-419🌍Latin American Spanish
- es-AR🇦🇷Spanish (Argentina)
- es-CL🇨🇱Spanish (Chile)
- es-CO🇨🇴Spanish (Colombia)
- es-ES🇪🇸European Spanish
- es-MX🇲🇽Mexican Spanish
- es-PE🇵🇪Spanish (Peru)
- es-US🇺🇸Spanish (United States)
- es-VE🇻🇪Spanish (Venezuela)
- et🇪🇪Estonian
- fa🇮🇷Persian
- fi🇫🇮Finnish
- fil🇵🇭Filipino
- fr🇫🇷French
- fr-BE🇧🇪French (Belgium)
- fr-CA🇨🇦Canadian French
- fr-CH🇨🇭Swiss French
- fr-CM🇨🇲French (Cameroon)
- fr-FR🇫🇷French (France)
- fr-SN🇸🇳French (Senegal)
- gu🇮🇳Gujarati
- he🇮🇱Hebrew
- hi🇮🇳Hindi
- hr🇭🇷Croatian
- hu🇭🇺Hungarian
- hy🇦🇲Armenian
- id🇮🇩Indonesian
- is🇮🇸Icelandic
- it🇮🇹Italian
- it-CH🇨🇭Italian (Switzerland)
- it-IT🇮🇹Italian (Italy)
- ja🇯🇵Japanese
- ka🇬🇪Georgian
- kk🇰🇿Kazakh
- kn🇮🇳Kannada
- ko🇰🇷Korean
- la🇻🇦Latin
- lt🇱🇹Lithuanian
- lv🇱🇻Latvian
- mk🇲🇰Macedonian
- ml🇮🇳Malayalam
- mn🇲🇳Mongolian
- mr🇮🇳Marathi
- ms🇲🇾Malay
- my🇲🇲Burmese
- nl🇳🇱Dutch
- nl-BE🇧🇪Flemish
- nl-NL🇳🇱Dutch (Netherlands)
- no🇳🇴Norwegian
- pa🇮🇳Punjabi
- pl🇵🇱Polish
- pt🇧🇷Portuguese
- pt-BR🇧🇷Brazilian Portuguese
- pt-PT🇵🇹European Portuguese
- ro🇷🇴Romanian
- ru🇷🇺Russian
- sk🇸🇰Slovak
- sl🇸🇮Slovenian
- so🇸🇴Somali
- sq🇦🇱Albanian
- sr🇷🇸Serbian
- sv🇸🇪Swedish
- sw🇹🇿Swahili
- sw-KE🇰🇪Swahili (Kenya)
- sw-TZ🇹🇿Swahili (Tanzania)
- ta🇮🇳Tamil
- te🇮🇳Telugu
- th🇹🇭Thai
- tl🇵🇭Filipino
- tr🇹🇷Turkish
- uk🇺🇦Ukrainian
- ur🇵🇰Urdu
- vi🇻🇳Vietnamese
- zh🇨🇳Chinese
- zh-CN🇨🇳Chinese (China)
- zh-HK🇭🇰Chinese (Hong Kong SAR China)
- zh-SG🇸🇬Chinese (Singapore)
- zh-TW🇹🇼Chinese (Taiwan)
注意事項
- General Translations は、言語や地域を内部的に識別するために Locale Tags (Locales) を使用します。
次のステップ
- General Translation で利用可能な言語タグを確認するには、List of Supported Locales をご覧ください。
- 詳細については、公式の IETF Language Tag Registry および BCP 47 Language Tag standard を参照してください。
このガイドはいかがですか?