一、数据在计算机中的表示
数据分为两种,一种是数值型数据,另一种是非数值型数据。这里只讨论数值型数据。
首先声明:
1、无论是二进制、八进制、十六进制还是十进制,大家都是一样的,十进制有的,其他进制也有。例如它们都有正负数之分,都有整数小数部分。
2、特别小心二进制数,所有的数据在计算机中都是用0和1的组合表示的,也可以说是二进制,但不是二进制数。一个二进制数在计算机中的表示是以这个二进制数的
补码形式表示的,由于二进制数可能是正数、负数、小数,所以它的补码可能会跟这个二进制数不相同。这样说,可能听起来有点意思,一个二进制数用二进制表示。
数值在计算机中的表示需要考虑的三个问题
1、存储长度:计算机存储数据是以字节为单位的,一个字节有8位。程序语言中int型有2个字节的,也有4个字节的。还有char
2、符号:数据有正负之分,约定“0”表示正,“1”表示负。
3、数据的表示。如果数据以有无小数的方式来分,则分为整数,纯小数,大于1的小数。表示方法可分为定点和浮点表示法。定点表示方法又可分为定点整数和定点小数。如果一个数是整数就用定点整数表示,如果是一个小于1的小数就用定点小数表示,如果是个大于1的小数,就是说既有整数部分,又有小数部分就用浮点表示。也就是说定点整数法表示整数,定点小数法表示纯小数,浮点法表示大于1的小数(小数定义:有小数点的数)。这样说来程序设计语言中float型的数据在计算机中的表示可能是用定点小数法,也可能用浮点法了,事实真的是这样吗?我不知道。浮点表示法也可以表示纯小数,那么还要定点小数法干嘛呢?因为定点小数法简单,便于运算。
4、浮点表示法:源自于科学表示形式,将一个数存储时分为两部分,指数部分和一个小于1 的小数部分。如果一个浮点数用4个字节表示,则指数部分占用一个字节,小数部分占用3个字节,小数部分最高位表示正负号。而且指数部分在高位。
5、原码、反码和补码。计算机是以补码的形式表示数值型数据的。正数的原码、反码、补码都是一样的。其实反码、补码的提出就是针对负数的,跟正数屁关系没有。也许只是为了统一一下说法“计算机都是以补码的形式表示数据的”,不然就得说正数是用原码表示,负数时用补码表示。
6、补码。负数在计算机中的表示步骤:原码——反码(符号位不变)——补码(加1)。由补码计算出负数真值的方法有两种。一是,补码减1——取反(符号位不变)——原码;二是,补码——取反后加1——原码。所有的取反都不涉及符号位。
记住计算机中一个二进制数是以其补码形式表示的,下面会有介绍。
二、计算机中的数制
1.几种数制
a. 十进制数:编程时使用,默认数字就是十进制
b. 二进制数:计算机内部信息存储,运算, 输出都是二进制数,源代码无法写出。
c. 八进制数:源代码中用0XX表示,如013,07723,0271。
d. 十六进制数:源代码中用0xXX表示,如0x13f,0xf2ea,0xac,字母不分大小写.
2.数值转换
几种进制数之间的转换方法:
三、有符号数
计算机只能识别0和1组成的数或代码,所以有符号数的符号也只能用0和1来表示。
真值、机器数和字长的概念
真值:一个数的数值.
用"+"表示正数,用"-"表示负数 表示正数, 如:+101 -101
机器数:计算机中用来表示有符号数的二进制数
首位为符号位,为0表示"+",为1表示"-",如0XXXXXXX 1XXXXXXX
字长:包括符号位在内,一个二进制数占有的位数。
字长n=8的二进制,符号位占1位,数值部分占7位。
由于数值部分的表示方法不同, 有符号数可有三种表示方法 , 即机器数有三种形式 , 分别叫 做原码,反码和补码.
四、原码、反码、补码
详细介绍
原码:原码表示的有符号数,最高位为符号位,数值 位部分就是该数的绝对值.
如一个字节: 十进制54 二进制源码:0011 0110
十进制-54 二进制源码:1011 0110
反码:反码表示的有符号数,也是把最高位规定为符号 但数值部分对于正数是其绝对值, 而对于负 数则是其绝对值按位取反( 数则是其绝对值按位取反(即1变0,0变1).
如一个字节: 十进制54 二进制源码:0011 0110 反码:不变
十进制-54 二进制源码:1011 0110 反码:1100 1001
补码:补码表示的有符号数,对于正数来说同原码,反码一样,但负数的数值位部分为其绝对值按位取反后末位加1所得
如一个字节: 十进制54 二进制源码:0011 0110 反码:不变 补码:不变
十进制-54 二进制源码:1011 0110 反码:1100 1001 补码: 1100 1010
注:1.负0补码和正0补码相同。
2.补码的数值范围
假设二进制数字长为n,表示整数,则补码范围(括号内为指数) -2(n-1) ~ 2(n-1) -1
8位补码 1000 0000 ~ 0111 1111
-128 ~ +127
16位补码 1000 0000 0000 0000 ~ 0111 1111 1111 1111
-32768 ~+32767
3.负数的原码的补码即等于补码,补码的补码又等于原码。
五、JAVA中的数据类型、是否有符号及范围
boolean
char 无符号 0 ~ 65535;
byte 带符号 -128 ~ +127
short 带符号 -32768 ~ +32767
int 带符号 -2147483648 ~ +2147483647
long 带符号 ...
float 带符号 ...
double 带符号 ...
注意:以上范围是指十进制,明白这点很重要。要想既然范围可以用十进制表示,那么同样可以用其他进制表示,因为下面要用到,所以这里写出int的十六进制数表示的范围(
结合上面说所原码反码补码来思考):
-2147483648 ~ -0 0x80000000 ~ 0xFFFFFFFF
+0 ~ 2147483647 0x00000000 ~ 0x7FFFFFFF
在Java中整数存在两种类型的字面量(字面值literal):整数型与长整型。如10是整数型字面量(int类型);10L是长整型字面量(long类型);
1.当字面量没有超出指定变量的数据类型的范围的时候,赋值是合法的,可以编译通过。 (合法赋值)
2.当字面量本身没有超出字面量类型的范围的时候,字面量是合法的,可以编译通过。 (合法字面量)
a为变量,=号后面为字面量,看一下源代码是否合法,注意不同进制所表示的字面量.
byte a=1; 合法
byte a=128; 超出范围:128超出了(变量a的数据类型)byte的范围。(不合法赋值)
int a=0xFFFFFFFF; 合法:0xFFFFFFFF在0x80000000~0xFFFFFFFF范围中,当然合法了,且原码的十进制表示为-1。
int a=2147483648; 超出范围:2147483648超出了(字面量类型)int的范围 (不合法字面量)
int a=(int)0xFFFFFFFFl; 合法:这里是long,自己算出long的十六进制范围,然后......不用多说了吧
long a=2147483648; 超出范围:2147483648超出了(字面量类型)int的范围
long a=2147483648l; 合法:2147483648是long,没超出long范围
int a=(int)2147483648l; 合法:这里是long,十进制数2147483648没超出long十进制表示的范围
注意:0xFFFFFFFF在Java中被认为是int,是因为后面同样没有跟l或L来表示long。
java中,byte范围是-128~127,如果要表示0~255怎么办?
比如一个字符±,ascii
编码是177(10110001),unicode编码是两个字节0,177(00000000,10110001),UTF-8编码(参考unicode到utf-8转换规则)是两个字节194,177(11000010,10110001)
byte[] buff="±".getBytes("iso-8859-1");
System.out.println((char)177);//a
System.out.println((char)buff[0]);//b
System.out.println(buff[0]);//c
FileOutputStream out=new FileOutputStream("a.txt");
out.write(buff);
out.close();
FileInputStream in=new FileInputStream("a.txt");
BufferedInputStream bis=new BufferedInputStream(in);
int x=bis.read();
bis.close();
System.out.println((char)x);//d
System.out.println(x);//e
System.out.println((byte)x);//f
1.a输出是±,b是?,c是-79;
根据ascii编码字符"±",编码后二进制表示则是10110001,一个字节长度8位,只用一个字节就能表示,如果使用其他使用无符号byte来存放值的语言,那buff[0]就等于177,但java的byte是带符号的,且二进制是用补码表示的,根据177的二进制数10110001,转换成原码就是-79,所以c处为-79.
2那如何让buff[0]能转换成ascii编码的二进制的真值,没有符号位?(ascii,unicode,utf-8等等二进制编码都没有符号位这一说,换成十进制都是相应正整数的值)
d输出是±,e是177,f是-79
in.read()方法api说明:Reads a byte of data from this input stream,从输入流中读取一个字节的数据,这里说的是读取一个字节的数据,而不是读取成一个byte,所以返回的是int(4个字节).
查看BufferedInputStream的read()方法的源码
public synchronized int read() throws IOException {
if (pos >= count) {
fill();
if (pos >= count)
return -1;
}
return getBufIfOpen()[pos++] & 0xff;//a
}
a处用了整数逐位运算&,将buf[pos](byte)和0xff(int)进行"与"运算,java语言规范规定,如果一个整数运算,至少有一个long操作数,那么将使用64位的精度执行运算,且结果是long类型,如果另外的操作数不是long,则将其数值加宽到long,否则将执行32位的精度运算,如果不是int则加宽到int,结果为int。所以这里byte会加宽到32位,然后与32位的0xff与运算,获得前24位全为0,低8位为真实数值的int类型整数,这样就将byte通过int类型表示成了0~255。