今まで利用していたPythonの文字列はすべてアルファベットと数字で構成されていました。今回は日本語のような「マルチバイト文字」を使ってみたいと思います。 基数 いきなり脱線なのですが、文字コードの話をする前に「基数」の話をしてしまい ...
今回は、 文字コードに関連するセキュリティの話題では古参ともいえるUTF-8の冗長なエンコードというテーマについて紹介します。 UTF-8とは UTF-8は、 各文字を1~4バイトの可変長で表現するUnicodeの符号化方式のひとつです。 U+0000からU+007Fの範囲の文字を ...