国際化、ローカリゼーション、エンコーディング、アイスランド、日本の猫の写真のウェブサイトの翻訳

国際化翻訳

国際化Webアプリケーション内の国際化、ローカリゼーション、およびエンコードに関しては、多くの情報があります。 また、それぞれがWebアプリケーションに何を提供するかについても多くの誤解があります。 これが私の見解です…

WebブラウザがWebサーバーに接続すると、かなりの数の変数が渡され、追加の要求が行われます。例を次に示します。

GET / HTTP / 1.1
ホスト:www.dknewmedia.com
ユーザーエージェント:Mozilla / 5.0(Macintosh; U; Intel Mac OS X; en-US; rv:1.8.1.3)Gecko / 20070309 Firefox / 2.0.0.3
Accept:HTTP Accept = text / xml、application / xml、application / xhtml + xml、text / html; q = 0.9、text / plain; q = 0.8、image / png、* / *; q = 0.5
Accept-Language:en-us、en; q = 0.5
Accept-Encoding:gzip、deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

国際化

国際化は多くのものの複合です:

  1. ローカリゼーション: 訪問者が訪問している言語と場所を識別する機能。 これは、訪問者がロケールによって識別されるHTTPリクエストを介して行われます。 私の場合、それは米国内です。 「en」は英語、「US」は米国です。 これは私のオペレーティングシステム内の設定です。
  2. 時間帯: タイムゾーンを調整する機能。 これは通常、サーバーをグリニッジ標準時(GMT)に設定し、ユーザーがGMTからのローカルオフセットを設定できるようにすることで実現されます。
  3. 文字コード: これは、言語の文字セットを適切に表示する機能です。 ローカリゼーションは、リクエストを送信しているコンピューターの言語と地域を教えてくれるので、ローカリゼーションとは異なりますが、どの言語かは教えてくれません。 読者 要求しています…それは読者次第です!

ブラウザがリクエストを行ったときのHTTPヘッダーで、自分のロケールをリクエストしていることをサーバーに通知しました(Accept-Language:en-us)。 ただし、要求されている文字セットをサーバーに通知する必要もあります(Accept-Charset:Accept-Charset:ISO-8859-1、utf-8; q = 0.7、*; q = 0.7)ISO-8859-1およびutf -8は両方とも許容される文字セットです。

ローカライゼーション

この幻想的な混同された世界では、ローカリゼーションはもはや言語を決定しません。 私はen-USにいますが、別の文字セットを使用して別の言語を絶対に読むことができます…それは私が使用するときに起こることです グーグルヒンディー語 (私は実際にはGoogleヒンディー語を使用していません)。 ロケールと文字セットのリクエストは、リクエストしたときと同じです。 グーグル英語 ページですが、文字セットがないために読めないページが実際に表示されます。 それはすべて出てきますか???????????…しかし、私はその文字セットをFirefoxにロードすることができます(Firefox>環境設定>詳細>言語):

Firefoxロード言語

その言語をロードすると、デフォルトのロケールがen-USであっても、ネイティブの文字セットでページを要求し、コンピューターに表示できます。

だから…もし私がヒンディー語の学生なら、パデュー大学で英語を勉強していて、 VPN 学校のサーバーに、オーストラリアでの休暇中に…真に国際化するためにアプリケーションに適用する必要がある3つの異なる設定があります–そして なし 他に依存します。

私のロケールはen-USとして表示されますが、私のタイムゾーンはオーストラリアですが、Webサイトから要求している言語はヒンディー語である可能性があります。 アプリケーションをプログラムして作成する場合 前提条件 私のコンピューターのロケールに基づいて、私は完全に間違っているでしょう–東部時間帯で人に英語を与えます。 理想的には、アプリケーションをプログラムして提供します どちらも 言語とタイムゾーンの設定…しかし、ロケールに基づいてそれらを想定することはしません。

アイスランド–究極の例

私たちは、私たちがいる米国での多言語および多地域の課題を知らない 英語を話す[皮肉を暗示する]。 アイスランドなど一部の国では、母国語はアイスランド語ですが、信じられないほどのアイスランド人は3つの言語を学んで成長します。 アイスランドはヨーロッパと北アメリカの真ん中にある国なので、彼らの会社はデスクトップから複数の大陸、言語、言語の方言、複数のタイムゾーンで働いています!

多くのアイスランド語のウェブサイトは、アメリカ英語、イギリス英語、アイスランド語、スペイン語、スペイン語、フランス語、ドイツ語で構築されています! 構築するのがどれほど難しいか想像してみてください アイスランド航空 ウェブサイトアプリケーションとチケットシステム…すごい!

免責事項:私はアイスランド航空の優秀な人々と一緒に仕事をすることを絶対に喜んでいます。彼らは私が一緒に仕事をすることの喜びを感じた中で最も才能がありフレンドリーな専門家の一部であると言えます。 それは単に素晴らしい国と人々です! 訪問に行く…アイスランド航空に乗り、必ず訪問してください 青い珊瑚礁!

言語とエンコーディング

単一の言語内には、互いにうまく機能しないさまざまな文字エンコードもあります。 例:Shift-JISで記述された日本の電子メールは、ローカリゼーションがja-JPに設定されている日本人のコンピューターでは、メールサーバーがEUC-JPしか認識しないため、読み取れなくなる可能性があります。 理想的には、顧客は希望するエンコーディングと言語を設定できる必要があります。エンコーディングと言語がクライアントが要求しているものと互換性があることを確認するだけです。

日本語を読みたい場合は、その言語を正しく表示するために、言語として日本語とエンコード用のShift-JISの両方を選択する必要がある場合があります。 ミックスに追加するいくつかの混乱があります…いくつかのエンコーディングタイプはいくつかの言語をサポートします。 UNICODE / UTF8は数十をサポートします。 逆もまた真です。 一部の言語は、多くのエンコーディングタイプで読み取ることができます。 それが意味をなさない場合…申し訳ありませんが、それは非常に複雑な問題です。

いつか私はこれがすべて変わると信じています(願っています)。 ローカリゼーションコードの元の設計者は、言語と国の組み合わせが必要なすべてであることを望んでいたと思います…しかし、私たちははるかに洗練されてきました。 これの多くはインターネットが存在する前に開発されたことを忘れないでください。 の出現で GIS、おそらく人は自分のエンコーディングを選択でき、GISはタイムゾーンとロケール情報を処理します。

国際化

国際化サポートに戻る。 国際化されたアプリケーションを提供する場合は、次のことを行う必要があります。

  1. 複数のエンコーディングタイプ、言語をサポートし、それらの翻訳を表示するための翻訳ファイルがあります。
  2. クライアントが言語を設定できるようにし、必要に応じてエンコードタイプも設定できるようにします。
  3. ユーザーがGMTと比較して自分のタイムゾーンを参照できるようにすることで、タイムゾーンをサポートします。
  4. ローカリゼーションコードは注意して使用してください…ユーザーが実際に要求しているものや読み取ることができるものを正確に描写していません。

翻訳

機械翻訳はまだ始まったばかりです。 そこにはたくさんのウェブサイトがあります(そして WordPress プラグイン)サイトの機械翻訳を提供します。 これをやろうとしないでください…XNUMXつの理由があります:

  1. 機械翻訳が機能する場合、サイトをチェックアウトしているユーザーには、作業する翻訳者がすでにいます。
  2. 機械翻訳は最悪です。

私を信じないの? これがあなたのための日本語訳です:
から貼り付け まさつファイル –猫の写真がたくさんある男:

日本のブログエントリ

???????????
–マサツによる00:29:35

???????????????????????????
??????????????????????????

??????????(?)?

????????????????????????????????????????
????????????????????????????

???????????????????????????????????(?)

?????????????????

??????????????
???????????
???????????

??????????????????????????????????????

???????????????????????????????

?????????????????????????????????????
?????????????????
?????????? アグ??????????????

?????????????????????????????????????

機械翻訳:

?? ハン?????
-00:29:35 by masatsu

昨日の「獣拳艦隊」に登場した象の拳聖人の名前?? 部隊" "?? ハン????」 ラジオ俳優の水島裕さんと…。

? (?)イカはなかなかします。

拳聖人のラジオ俳優でさえ、マスター????? 猫のは永井一郎のカリン=ドラゴンボールのスタッフは?? レンジャーは機知に富んだ発言をしている人のように見えます。

今年は「スーパーフリートの名前の秘密」をすっかり忘れていた??????(汗)、毎年恒例の練習?、

??????今年遅ればせながら書くと、

??????? 神社??? (どうやって?)? 岬のカリオン(??カットしない)深見?? (?または観察できる?)そして/それは

??????と、名前の頭を並べて変更すると、「缶/?/?」、つまり「カンフー」になります。

??????さらにXNUMXつ増えると言われていますが、どんな名前になるかもしれません。

銀の元素記号がAg?であるため、真実は「年齢」と言われていますが、「????」の名前はシルバー」高岡? ???????の技術者「?」というキャラクターだと思っていました追加メンバーと呼ばれる場合は、シルバーの「スクリーン」映画の関連付けで使用されました。

??????しかし、私の理論は「?」と無関係ではないと勝手に考えています。 漢字に含まれています。

この翻訳の極性を逆にすると、英語で同じように読みやすい辞書が提供されると確信しています。 エントリーを理解しましたよね?

2のコメント

  1. 1

    Purdueのことですか?
    確かに、汗まみれのラジオ俳優は、特定のことを言う正しい方法を考えていました…。

どう思いますか?

このサイトはAkismetを使用して迷惑メールを減らします。 コメントの処理方法を学ぶ.