一. Socket介绍

1. Socket是啥

我们先从插头说起,当我们把插头插入插座,那看起来就像插头和插座连在了一起

fcecedcd9381b902.webp

而插座的英文叫做socket

在进行网络编程的时候,我们也可以通过socekt进行连接

bb2cb03038081260.webp

所以socket是来连接两个设备的,即有服务端和客户端之分,这俩的代码也是不一样的。

2. Socket的网络连接

既然Socket主要是用来解决网络通信的,那么我们就来理解网络中进程是如何通信的。

1. 本地进程间通信

  • 1、消息传递(管道、消息队列、FIFO)
  • 2、同步(互斥量、条件变量、读写锁、文件和写记录锁、信号量)?【不是很明白】
  • 3、共享内存(匿名的和具名的,eg:channel)
  • 4、远程过程调用(RPC)

2. 网络中进程如何通信

我们要理解网络中进程如何通信,得解决两个问题:

  • 1、我们要如何标识一台主机,即怎样确定我们将要通信的进程是在那一台主机上运行。
  • 2、我们要如何标识唯一进程,本地通过pid标识,网络中应该怎样标识?

解决办法:

  • 1、TCP/IP协议族已经帮我们解决了这个问题,网络层的“ip地址”可以唯一标识网络中的主机
  • 2、传输层的“协议+端口”可以唯一标识主机中的应用程序(进程),因此,我们利用三元组(ip地址,协议,端口)就可以标识网络的进程了,网络中的进程通信就可以利用这个标志与其它进程进行交互。

3. Socket怎么通信

现在,我们知道了网络中进程间如何通信,即利用三元组【ip地址,协议,端口】可以进行网络间通信了,那我们应该怎么实现了,因此,我们socket应运而生,它就是利用三元组解决网络通信的一个中间件工具,就目前而言,几乎所有的应用程序都是采用socket,如UNIX BSD的套接字(socket)和UNIX System V的TLI(已经被淘汰)。
Socket通信的数据传输方式,常用的有两种:

  • a、SOCK_STREAM:表示面向连接的数据传输方式。数据可以准确无误地到达另一台计算机,如果损坏或丢失,可以重新发送,但效率相对较慢。常见的 http 协议就使用 SOCK_STREAM 传输数据,因为要确保数据的正确性,否则网页不能正常解析。

  • b、SOCK_DGRAM:表示无连接的数据传输方式。计算机只管传输数据,不作数据校验,如果数据在传输中损坏,或者没有到达另一台计算机,是没有办法补救的。也就是说,数据错了就错了,无法重传。因为 SOCK_DGRAM 所做的校验工作少,所以效率比 SOCK_STREAM 高。

例如:QQ 视频聊天和语音聊天就使用 SOCK_DGRAM 传输数据,因为首先要保证通信的效率,尽量减小延迟,而数据的正确性是次要的,即使丢失很小的一部分数据,视频和音频也可以正常解析,最多出现噪点或杂音,不会对通信质量有实质的影响。

具体的就是TCP的三次握手四次挥手

二. Socket常用函数接口及其原理

1. 图解

图解socket函数:

e3be286a1c516bfb.webp

2. 服务端过程

(1) 使用socket()函数创建套接字

1
socket.socket(family, type, proto)
  • family:套接字家族 AF_UNIX(进程间通信)、AF_INET(TCP/UDP通信),默认为AF_INET,这里默认就行了。
  • type:SOCK_STREAM(数据流,一般是TCP协议)、SOCK_DGRAM(数据包,udp协议),默认是
  • proto:一般不填,默认为0

比如我们想要建立一个TCP类型的socket,是这样的

1
2
s = socket.socket()  # 这样默认就是TCP连接
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 这是完整的,proto不用管它

我们要是想要建立UDP类型的Socket:

1
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)

(2) bind绑定服务端IP

这是通过socket对象的bind方法来实现的:

1
2
s = socket.socket()
s.bind( address )

由AF_INET所创建的套接字,address地址必须是一个双元素元组,格式是(host,port)。host代表主机,port代表端口号。

啥意思呢?我们上面无论是TCP还是UDP用的都是 AF_INET ,所以我们接下来 address = (服务端IP, 服务端开放的端口)

加一起就是这样的:

1
2
s = socket.socket()
s.bind( (服务端IP, 服务端开放的端口) )

主要注意的是,这个address是个元组,即bind后面是俩括号

如果端口号正在使用、主机名不正确或端口已被保留,bind方法将引发socket.error异常

(3) listen方法接收连接请求

backlog指定最多允许多少个客户连接到服务器。它的值至少为1。

收到连接请求后,这些请求需要排队,如果队列满,就拒绝请求。

正常来说backlog为5就行了,即

1
2
s = socket.socket()
s.listen(5)

(4) accept方法等待客户请求一个连接

1
2
s = socket.socket()
connection, address = s.accept()

这里注意,是两个变量。

即 s.accept()的结果返回的是俩东西。第一个元素connection是新的socket对象,服务器必须通过它与客户通信;第二个元素 address是客户的Internet地址。

调用accept方法时,socket会时入“waiting”状态。客户请求连接时,方法建立连接并返回服务器

(5) 处理阶段

服务器和客户端通过send和recv方法通信(传输 数据)。

服务器调用send,并采用字符串形式向客户发送信息。send方法返回已发送的字符个数。

服务器使用recv方法从客户接收信息。调用recv 时,服务器必须指定一个整数,它对应于可通过本次方法调用来接收的最大数据量。

recv方法在接收数据时会进入“blocked”状态,最后返回一个字符串,用它表示收到的数据。

如果发送的数据量超过了recv所允许的,数据会被截短。多余的数据将缓冲于接收端。以后调用recv时, 多余的数据会从缓冲区 删除(以及自上次调用recv以来,客户可能发送的其它任何数据)。

(6) 传输结束

服务器调用socket的close方法关闭连接

3. 客户端过程

(1) 创建一个socket以连接服务器

1
s = socket.socket()

(2) connect方法连接服务器

对于AF_INET家族,连接格式如下

1
socket.connect( (host,port) )

host代表服务器主机名或IP,port代表服务器进程所绑定的端口号。

如连接成功,客户就可通过套接字与服务器通信,如果连接失败,会引发socket.error异常。

(3) 处理阶段

客户和服务器将通过send方法和recv方法通信。

(4) 传输结束

客户通过调用socket的close方法关闭连接。

4. Socket 函数

注意点:

1)TCP发送数据时,已建立好TCP连接,所以不需要指定地址。UDP是面向无连接的,每次发送要指定是发给谁。

2)服务端与客户端不能直接发送列表,元组,字典。需要字符串化repr(data)。

服务端函数 描述
s.bind(address) 将套接字绑定到地址, 在AF_INET下,以元组(host,port)的形式表示地址
s.listen(backlog) 开始监听TCP传入连接。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,大部分应用程序设为5就可以了。
s.accept() 接受TCP连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。
客户端函数 描述
s.connect(address) 连接到address处的套接字。一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
s.connect_ex(adddress) 功能与connect(address)相同,但是成功返回0,失败返回errno的值。

| 公共函数 | 描述 |
| ———————————— | ———————————————————————————————————————————————————————————– | ———————— |
| s.recv(bufsize[,flag]) | 接受TCP套接字的数据。数据以字符串形式返回,bufsize指定要接收的最大数据量。flag提供有关消息的其他信息,通常可以忽略。 |
| s.send(string[,flag]) | 发送TCP数据。将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。 |
| s.sendall(string[,flag]) | 完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。 |
| s.recvfrom(bufsize[.flag]) | 接受UDP套接字的数据。与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。 |
| s.sendto(string[,flag],address) | 发送UDP数据。将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。 |
| s.close() | 关闭套接字。 |
| s.getpeername() | 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。 |
| s.getsockname() | 返回套接字自己的地址。通常是一个元组(ipaddr,port) |
| s.setsockopt(level,optname,value) | 设置给定套接字选项的值。 | |
| s.getsockopt(level,optname[.buflen]) | 返回套接字选项的值。 |
| s.settimeout(timeout) | 设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect()) |
| s.gettimeout() | 返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None。 |
| s.fileno() | 返回套接字的文件描述符。 |
| s.setblocking(flag) | 如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。 | |
| s.makefile() | 创建一个与该套接字相关连的文件 |

5. 例子

我们现在有两个主机,一个是win10,一个是kali linux

win10充当服务端,IP为 172.40.66.163

kali linux充当客户端,IP为 192.168.40.129

这两台主机能够相互ping通,即他俩能正常通信

我们先看服务端的代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
# 服务端IP:172.40.66.163  
# 客户端IP:192.168.40.129


# 服务端
import socket

# 创建了一个基于ipv4的,tcp协议的的socket对象
service = socket.socket() # 建立socket TCP连接,实例化为sock

service.bind(('172.40.66.163', 8001)) # 绑定本地(服务端)IP,以及对应的端口

''' 你也可以这样写 client.bind(('0.0.0.0', 8001))
0.0.0.0表示绑定服务端上所有网卡的IP
'''

service.listen(5) # 开启监听模式

# 接收客户端的连接,创建socket连接对象,并且返回客户端的连接地址信息
connection, address = service.accept() # 通过accept来等待客户端的信息

data = connection.recv(1024) # 接收客户端发送的消息,1024指每次接收数据量的大小

# 输出客户端发来的消息
print(data.decode()) # 使用decode是因为通过sock传入的是bytes类型的数据,需要解码才能正确显示

# 向客户端发送消息
connection.send('我是服务端'.encode()) # 这个 "我是服务端" 是个字符串,我们需要encode一下

connection.close()

客户端:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# 服务端IP:172.40.66.163  
# 客户端IP:192.168.40.129

import socket

client = socket.socket() # 默认TCP连接

client.connect(('172.40.66.163', 8001)) # 服务端IP,以及服务端开放的端口

# 向服务端发送消息
client.send('我是客户端'.encode()) # 这个 "我是客户端" 是个字符串,我们需要encode一下

data = client.recv(1024) # 接受服务端发来的消息

print(data.decode()) # 打印从服务端发来的消息

client.close() # 关闭

我们先在服务器端,即在win10上运行服务端的代码,然后再在kali上运行客户端的代码

我们先运行服务端

df9706f9f54ef246.webp

可以看到,程序停在了这里,为啥它不会往下走呢?

因为程序被 accecp() 函数阻塞了,等待来自客户端的消息。

我们运行客户端,然后看客户端和服务端上有啥反应

6112cf257c30906d.webp

可以看到,已经能够发送信息了。