1. 二进制—计算机表示数据的方式

$123 = 1 \times 10 ^2 + 2 \times 10 ^1 + 3 \times 10 ^ 0$

$abc_{(N)} = a \times k^m + b \times k^{m-1} + c \times k^{m-2} + ...$

二进制的位权为2，基本数字只有0和1，整好符合计算机的高低电平。因此十进制数4可以表示为:

$4_{(10)} = 1 \times 2^2 + 0 \times 2^1 + 0 \times 2^0 = 100_{(2)}$

十进制的负数只需要在数字前面加上负号就表示负数了，而二进制的负数与十进制类似，在最高添加一个符号为，1表示负数，0表示整数，每种类型的数据都是最左边的一位。但负数实际上不是简单的给最高位设置符号。例如：

使用补码表示是因为计算机只会计算加法，通过补码的表示计算机能够通过加法做减法运算。

由于二进制书写不方便，加上越大的数，二进制越长，因此使用16进制来替代二进制。十六进制的数字分别为(0~9、A[10]、B[11]、C[12]、D[13]、E[14]和F[15])

1 2	`Integer.toBinaryString(Float.floatToIntBits(value)); Long.toBinaryString(Double.doubleToLongBits(value));`

2. 字符集与编码

为全世界的字符进行统一编码，它没有规定编码如何对应二进制表示。常用的字符二进制编码方案有如下几种：

UTF-32：字符编号的整数二进制形式，4字节
UTF-16：变长字节表示，编号在U+0000~U+FFFF使用两字节；编号在U+10000~U+10FFFF使用四字节。使用U+D800~U+DBFF的就是4字节，否则为2字节；
UTF-8：依旧使用变长字节表示，每个字符使用的字节个数与Unicode编号的大小有关；

假设字符需要从编码A转换为编码B，那么首先需要知道字符所对应的编码A的格式，通过编码A的Unicode字符映射表找到其Unicode编号，然后通过Unicode编号再查找编码B的映射表。
```
graph LR;
 字符s的编码A --> 字符s对应Unicode的序号 --> 字符s的编码B
```

编码转换实际上只是改变了字符的二进制内容，但并没有改变字符看上去的样子。

1
2
3

String str = "value to encdoe";
String newStr = new String(str.getBytes("Windows-1252"), "GB18030");
System.out.println(newStr);

Java

Java基础

本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！