1. 网络编程概述
- Java是Internet上的语言,它从语言级提供了对网络应用程序的支持,程序员能够很容易地开发常见的网络应用程序
- Java提供的网络类库,可以实现无痛的网络连接,联网的底层细节被隐藏在Java本机安装系统里,由JVM进行控制。并且Java实现了一个跨平台的网络库,程序员面对的是一个统一的网络编程环境
- 计算机网络:把分布在不同地理区域的计算机与专门的外部设备用通信线路互连成一个规模大、功能强的网络系统,从而使众多的计算机可以方便地互相传递信息、共享硬件、软件、数据信息等资源
- 网络编程的目的:直接或间接地通过网络协议与其它计算机实现数据交换,进行通讯。
网络编程中有两个主要问题:
- 如何准确地定位网络上一台或多台主机
- 找到主机后如何可靠高效地进行数据传输
2. 网络通信要素
2.1 IP和端口号
IP地址:InetAddress
- 唯一的标识Internet上的计算机(通信实体)
- 本地回环地址:
127.0.0.1
,主机名:localhost
IP地址的分类方式1:IPV4和IPV6
- IPV4:4个字节组成,即4个0~255,大概42亿个地址,其中30亿都在北美,亚洲4亿。2011年初已经用尽,使用点分十进制标识,如192.168.0.1
- IPV6:128为(16个字节),写成8个无符号整数,每个整数用四个十六进制位表示,数之间用冒号隔开,如:3ffe:3201:1401:1280:c8ff:fe4d:db39:1984
- IP地址分类方式2:公网地址(万维网使用)和私有地址(局域网使用)。192.168.开头的就是私有地址,范围为192.168.0.0~192.168.255.255,专门为组织结构内部使用
- 特点:不易记忆
端口号标识正在计算机上运行的进程(程序)
- 不同的进程有不同的端口号
- 被规定为一个16位的整数0~65535
端口分类:
- 公认端口:0~1023:被预先定义的服务通信占用(如:HTTP占用端口80,FTP占用21,Telnet占用23)
- 注册端口:1024~49151:分配给用户进程或应用程序。(如:Tomcat占用端口8080,MySQL占用端口3306,Oracle占用端口1521等)
- 动态/私有端口:49152~65535
- 端口号与IP地址组合得出一个网络套接字:Socket
InetAddress
类:Internet上的主机有两种表示地址:
- 域名(hostname):www.hxuanyu.com
- IP地址:82.146.30.246
InetAddress
类主要表示IP地址,有两个子类:Inet4Address
、Inet6Address
InetAddress
类对象含有一个Internet主机地址的域名和IP地址- 域名容易记忆,当在连接网络时输入一个主机的域名后,域名服务器负责将域名转化成IP地址,这样才能和主机建立连接。
InetAddress
类没有提供公共的构造器,而是提供了如下几个静态方法来获取InetAddress
实例public static InetAddress getLocalHost()
public static InetAddress getByName(String host)
InetAddress
提供了如下几个常用的方法public String getHostAddress()
:返回 IP 地址public String getHostName()
:获取此 IP 地址的主机名public boolean isReachable(int timeout)
:测试是否可以达到该地址
public static void main(String[] args) {
try {
// 根据域名获取
InetAddress inetAddress1 = InetAddress.getByName("baidu.com");
System.out.println(inetAddress1);
// 根据ip获取
InetAddress inetAddress2 = InetAddress.getByName("39.156.69.79");
System.out.println(inetAddress2);
// 获取本地地址
InetAddress inetAddress3 = InetAddress.getLocalHost();
System.out.println(inetAddress3);
} catch (UnknownHostException e) {
e.printStackTrace();
}
}
2.2 网络协议
- 网络通信协议:计算机网络中实现通信必须有一些约定,即通信协议,对速率、传输代码、代 码结构、传输控制步骤、出错控制等制定标准。
- 通信协议分层思想:在制定协议时,把复杂成份分解成一些简单的成份,再将它们复合起来。最常 用的复合方式是层次方式,即同层间可以通信、上一层可以调用下一层,而与 再下一层不发生关系。各层互不影响,利于系统的开发和扩展。
2.2.1 TCP/IP协议簇
传输层协议中有两个非常重要的协议:
- 传输控制协议TCP(Transmission Control Protocol)
- 用户数据报协议UDP(User Datagram Protocol)。
- TCP/IP 以其两个主要协议:传输控制协议(TCP)和网络互联协议(IP)而得 名,实际上是一组协议,包括多个具有不同功能且互为关联的协议。
- IP(Internet Protocol)协议是网络层的主要协议,支持网间互连的数据通信。
- TCP/IP协议模型从更实用的角度出发,形成了高效的四层体系结构,即 物理链路层、IP层、传输层和应用层。
2.2.2 TCP和UDP
TCP协议:
- 使用TCP协议前,须先建立TCP连接,形成传输数据通道
- 传输前,采用“三次握手”方式,点对点通信,是可靠的
- TCP协议进行通信的两个应用进程:客户端、服务端。
- 在连接中可进行大数据量的传输
- 传输完毕,需释放已建立的连接,效率低
UDP协议:
- 将数据、源、目的封装成数据包,不需要建立连接
- 每个数据报的大小限制在64K内
- 发送不管对方是否准备好,接收方收到也不确认,故是不可靠的
- 可以广播发送
- 发送数据结束时无需释放资源,开销小,速度快
2.2.3 Socket
- 利用套接字(Socket)开发网络应用程序早已被广泛的采用,以至于成为事实上的标准。
- 网络上具有唯一标识的IP地址和端口号组合在一起才能构成唯一能识别的标识符套接字。
- 通信的两端都要有Socket,是两台机器间通信的端点。
- 网络通信其实就是Socket间的通信。
- Socket允许程序把网络连接当成一个流,数据在两个Socket间通过IO传输。
- 一般主动发起通信的应用程序属客户端,等待通信请求的为服务端。
Socket分类:
- 流套接字(stream socket):使用TCP提供可依赖的字节流服务
- 数据报套接字(datagram socket):使用UDP提供“尽力而为”的数据报服务
Socket常用构造器:
public Socket(InetAddress address,int port)
创建一个流套接字并将其连接到指定 IP 地址的指定端口号。public Socket(String host,int port)
创建一个流套接字并将其连接到指定主机上的指定端口号。
Socket常用方法:
public InputStream getInputStream()
返回此套接字的输入流。可以用于接收网络消息public OutputStream getOutputStream()
返回此套接字的输出流。可以用于发送网络消息public InetAddress getInetAddress()
此套接字连接到的远程 IP 地址;如果套接字是未连接的,则返回null
。public InetAddress getLocalAddress()
获取套接字绑定的本地地址。 即本端的IP地址public int getPort()
此套接字连接到的远程端口号;如果尚未连接套接字,则返回0
。public int getLocalPort()
返回此套接字绑定到的本地端口。 如果尚未绑定套接字,则返回-1
。即本端的 端口号。public void close()
关闭此套接字。套接字被关闭后,便不可在以后的网络连接中使用(即无法重新连接 或重新绑定)。需要创建新的套接字对象。关闭此套接字也将会关闭该套接字的InputStream
和OutputStream
。public void shutdownInput()
如果在套接字上调用shutdownInput()
后从套接字输入流读取内容,则流将 返回EOF
(文件结束符)。 即不能在从此套接字的输入流中接收任何数据。public void shutdownOutput()
禁用此套接字的输出流。对于 TCP 套接字,任何以前写入的数据都将被发 送,并且后跟 TCP 的正常连接终止序列。 如果在套接字上调用shutdownOutput()
后写入套接字输出流, 则该流将抛出IOException
。 即不能通过此套接字的输出流发送任何数据。
3. TCP网络编程
3.1 客户端
客户端Socket的工作过程包含以下四个基本步骤:
- 创建Socket:根据指定服务端的IP地址或端口号构造Socket类对象。若服务端响应,则建立客户端到服务器的通信线路。若连接失败,会出现异常
- 打开连接到Socket的输入/输出流:使用
getInputStream()
方法获得输入流,使用getOutputStream()
方法获得输出流,进行数据传输 - 按照一定的协议对Socket进行读写操作:通过输入流读取服务器放入线路的信息(但不能读取自己放入线路的信息),通过输出流将信息写入线程
- 关闭Socket:断开客户端到服务器的连接,释放线路
客户端程序可以使用Socket类创建对象,创建的同时会自动向服务器发起连接。
Socket(String host, int port) throws UnknownHostException, IOException
:向服务器发起TCP连接,若成功,则创建Socket对象,否则抛出异常Socket(InetAddress, int port)throws IOException
:根据InetAddress
对象所表示的IP地址以及端口号发起连接
- 客户端建立
socketAtClient
对象的过程就是向服务器发出套接字连接请求的过程
/**
* 客户端
*/
@Test
public void client() {
Socket socket = null;
OutputStream os = null;
try {
InetAddress inetAddress = InetAddress.getLocalHost();
socket = new Socket(inetAddress, 8899);
os = socket.getOutputStream();
os.write("hello, i am client".getBytes());
} catch (IOException e) {
e.printStackTrace();
} finally {
if (os != null) {
try {
os.close();
} catch (IOException e) {
e.printStackTrace();
}
}
if (socket != null) {
try {
socket.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}
3.2 服务端
服务器程序的工作过程包含以下四个基本的步骤:
- 调用
ServerSocket(int port)
:创建一个服务器端套接字,并绑定到指定端口 上。用于监听客户端的请求。 - 调用
accept()
:监听连接请求,如果客户端请求连接,则接受连接,返回通信 套接字对象。 - 调用 该
Socket
类对象的getOutputStream()
和getInputStream ()
:获取输出 流和输入流,开始网络数据的发送和接收。 - 关闭
ServerSocket
和Socket
对象:客户端访问结束,关闭通信套接字。
- 调用
ServerSocket
对象负责等待客户端请求建立套接字连接,类似邮局某个窗口 中的业务员。也就是说,服务器必须事先建立一个等待客户请求建立套接字 连接的ServerSocket
对象。- 所谓“接收”客户的套接字请求,就是
accept()
方法会返回一个Socket
对象
/**
* 服务端
*/
@Test
public void server() {
ServerSocket serverSocket = null;
Socket socket = null;
InputStream is = null;
ByteArrayOutputStream baos = null;
try {
serverSocket = new ServerSocket(8899);
socket = serverSocket.accept();
is = socket.getInputStream();
baos = new ByteArrayOutputStream();
byte[] buffer = new byte[1024];
int len;
while ((len = is.read(buffer)) != -1) {
baos.write(buffer, 0, len);
}
String str = baos.toString();
System.out.println(str);
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
if (serverSocket != null) {
serverSocket.close();
}
} catch (IOException e) {
e.printStackTrace();
}
try {
if (socket != null) {
socket.close();
}
} catch (IOException e) {
e.printStackTrace();
}
try {
if (is != null) {
is.close();
}
} catch (IOException e) {
e.printStackTrace();
}
try {
if (baos != null) {
baos.close();
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
4. UDP网络编程
- 类
DatagramSocket
和DatagramPacket
实现了基于UDP协议的网络程序。 - UDP数据报通过数据报套接字
DatagramSocket
发送和接收,系统不保证UDP数据报一定能够安全送到目的地,也不能确定什么时候可以抵达。 DatagramPacket
对象封装了UDP数据报,在数据报中包含了发送端的IP地址和端口号以及接收端的IP地址和端口号。- UDP协议中每个数据报都给出了完整的地址信息,因此无须建立发送方和接受方的连接。如同发快递包裹一样
DatagramSocket
常用方法:public DatagramSocket(int port)
创建数据报套接字并将其绑定到本地主机上的指定端口。套接字将被 绑定到通配符地址,IP 地址由内核来选择。public DatagramSocket(int port,InetAddress laddr)
创建数据报套接字,将其绑定到指定的本地地址。 本地端口必须在 0 到 65535 之间(包括两者)。如果 IP 地址为0.0.0.0
,套接字将被绑定到通配符地 址,IP 地址由内核选择。public void close()
关闭此数据报套接字。public void send(DatagramPacket p)
从此套接字发送数据报包。DatagramPacket
包含的信息指示:将 要发送的数据、其长度、远程主机的 IP 地址和远程主机的端口号。public void receive(DatagramPacket p)
从此套接字接收数据报包。当此方法返回时,DatagramPacket
的缓冲区填充了接收的数据。数据报包也包含发送方的 IP 地址和发送方机器上的端口号。 此方法 在接收到数据报前一直阻塞。数据报包对象的 length 字段包含所接收信息的长度。如果信息比包的 长度长,该信息将被截短。public InetAddress getLocalAddress()
获取套接字绑定的本地地址。public int getLocalPort()
返回此套接字绑定的本地主机上的端口号。public InetAddress getInetAddress()
返回此套接字连接的地址。如果套接字未连接,则返回null
。public int getPort()
返回此套接字的端口。如果套接字未连接,则返回 -1。
DatagramPacket
常用方法public DatagramPacket(byte[] buf,int length)
构造DatagramPacket
,用来接收长 度为length
的数据包。length
参数必须小于等于buf.length
。public DatagramPacket(byte[] buf,int length,InetAddress address,int port)
构造数 据报包,用来将长度为length
的包发送到指定主机上的指定端口号。length
参数必须小于等于buf.length
。public InetAddress getAddress()
返回某台机器的 IP 地址,此数据报将要发往该 机器或者是从该机器接收到的。public int getPort()
返回某台远程主机的端口号,此数据报将要发往该主机或 者是从该主机接收到的。public byte[] getData()
返回数据缓冲区。接收到的或将要发送的数据从缓冲区 中的偏移量offset
处开始,持续length
长度。public int getLength()
返回将要发送或接收到的数据的长度。
/**
* 发送端
*/
@Test
public void sender() throws IOException {
DatagramSocket datagramSocket = null;
try {
datagramSocket = new DatagramSocket();
String str = "我是UDP发送的数据包";
byte[] data = str.getBytes();
InetAddress inet = InetAddress.getLocalHost();
DatagramPacket datagramPacket = new DatagramPacket(data, 0, data.length, inet, 9090);
datagramSocket.send(datagramPacket);
} catch (IOException e) {
e.printStackTrace();
} finally {
if (datagramSocket != null) {
datagramSocket.close();
}
}
}
/**
* 接收端
*/
@Test
public void receiver() {
DatagramSocket datagramSocket = null;
try {
datagramSocket = new DatagramSocket(9090);
byte[] buffer = new byte[1024];
DatagramPacket packet = new DatagramPacket(buffer, 0, buffer.length);
datagramSocket.receive(packet);
System.out.println(new String(packet.getData(), 0, packet.getLength()));
} catch (IOException e) {
e.printStackTrace();
} finally {
if (datagramSocket != null) {
datagramSocket.close();
}
}
}
5. URL编程
5.1 URL类
- URL(Uniform Resource Locator):统一资源定位符,它表示 Internet 上某一 资源的地址。
- 它是一种具体的URI,即URL可以用来标识一个资源,而且还指明了如何locate 这个资源。
- 通过 URL 我们可以访问 Internet 上的各种网络资源,比如最常见的 www,ftp 站点。浏览器通过解析给定的 URL 可以在网络上查找相应的文件或其他资源。
URL的基本结构由5部分组成:
<传输协议>://<主机名>:<端口号>/<文件名>#片段名?参数列表
- 例如: http://192.168.1.100:8080/helloworld/index.jsp#a?username=shkstart&password=123
- 片段名:即锚点,例如看小说,直接定位到章节
- 参数列表格式:参数名=参数值&参数名=参数值....
为了表示URL,
java.net
中实现了类URL
。我们可以通过下面的构造器来初 始化一个URL
对象:public URL (String spec)
:通过一个表示URL地址的字符串可以构造一个URL
对象。例 如:URL url = new URL ("http://www. hxuanyu.com/");
public URL(URL context, String spec)
:通过基URL
和相对URL
构造一个URL
对象。 例如:URL downloadUrl = new URL(url, “download.html")
public URL(String protocol, String host, String file);
例如:new URL("http", "www.hxuanyu.com", “download. html");
public URL(String protocol, String host, int port, String file);
例如:URL gamelan = new URL("http", "www.hxuanyu.com", 80, “download.html");
URL
类的构造器都声明抛出非运行时异常,必须要对这一异常进行处理,通 常是用try-catch
语句进行捕获。一个
URL
对象生成后,其属性是不能被改变的,但可以通过它给定的 方法来获取这些属性:public String getProtocol( )
获取该URL的协议名public String getHost( )
获取该URL的主机名public String getPort( )
获取该URL的端口号public String getPath( )
获取该URL的文件路径public String getFile( )
获取该URL的文件名public String getQuery( )
获取该URL的查询名
public class URLTest {
public static void main(String[] args) {
try {
URL url = new URL("https://hxuanyu.com:8080/examples/test.jpg?size=1024");
System.out.println("url.getProtocol():" + url.getProtocol());
System.out.println("url.getHost():" + url.getHost());
System.out.println("url.getPort():" + url.getPort());
System.out.println("url.getPath():" + url.getPath());
System.out.println("url.getFile():" + url.getFile());
System.out.println("url.getQuery():" + url.getQuery());
;
} catch (MalformedURLException e) {
e.printStackTrace();
}
}
}
5.2 针对HTTP协议的URLConnecxtion类
URL
的方法openStream()
:能从网络上读取数据- 若希望输出数据,例如向服务器端的 CGI (公共网关接口-Common Gateway Interface-的简称,是用户浏览器和服务器端的应用程序进行连接的接口)程序发送一 些数据,则必须先与URL建立连接,然后才能对其进行读写,此时需要使用
URLConnection
。 URLConnection
:表示到URL所引用的远程对象的连接。当与一个URL建立连接时, 首先要在一个 URL 对象上通过方法openConnection()
生成对应的URLConnection
对象。如果连接过程失败,将产生IOException
.URL netchinaren = new URL ("http://www.hxuanyu.com/index.html");
URLConnectonn u = netchinaren.openConnection( );
通过
URLConnection
对象获取的输入流和输出流,即可以与现有的CGI 程序进行交互。public Object getContent( ) throws IOException
public int getContentLength( )
public String getContentType( )
public long getDate( )
public long getLastModified( )
public InputStream getInputStream( )throws IOException
public OutputSteram getOutputStream( )throws IOException
public class URLTest {
public static void main(String[] args) {
HttpURLConnection urlConnection = null;
InputStream is = null;
FileOutputStream fos = null;
try {
URL url = new URL("https://hxuanyu.com/api/loveimg");
urlConnection = (HttpURLConnection) url.openConnection();
urlConnection.connect();
is = urlConnection.getInputStream();
fos = new FileOutputStream("img.jpg");
byte[] buffer = new byte[1024];
int len;
while ((len = is.read(buffer)) != -1) {
fos.write(buffer, 0, len);
}
System.out.println("下载成功~");
} catch (IOException e) {
e.printStackTrace();
} finally {
if (is != null) {
try {
is.close();
} catch (IOException e) {
e.printStackTrace();
}
}
if (fos != null) {
try {
fos.close();
} catch (IOException e) {
e.printStackTrace();
}
}
if (urlConnection != null) {
urlConnection.disconnect();
}
}
}
}
5.3 URI、URL、URN的区别
URI,是uniform resource identifier,统一资源标识符,用来唯一的标识一个 资源。而URL是uniform resource locator,统一资源定位符,它是一种具体 的URI,即URL可以用来标识一个资源,而且还指明了如何locate这个资源。 而URN,uniform resource name,统一资源命名,是通过名字来标识资源, 比如mailto:java-net@java.sun.com
。也就是说,URI是以一种抽象的,高层 次概念定义统一资源标识,而URL和URN则是具体的资源标识的方式。URL 和URN都是一种URI。 在Java的URI中,一个URI实例可以代表绝对的,也可以是相对的,只要它符 合URI的语法规则。而URL类则 不仅符合语义,还包含了定位该资源的信息, 因此它不能是相对的。