网络服务器的几种并发服务模型_服务器知识

服务程序最为关键的设计是并发服务模型，当前有以下几种典型的模型：

- 单进程服务，使用非阻塞IO

使用一个进程服务多个客户，通常与客户通信的套接字设置为非阻塞的，阻塞只发生在select()、poll()、epoll_wait()等系统调用上面。这是一种行之有效的单进程状态机式服务方式，已被广泛采用。

缺点是它无法利用SMP(对称多处理器)的优势，除非启动多个进程。此外，它尝试就绪的IO文件描述符后，立即从系统调用返回，这会导致大量的系统调用发生，尤其是在较慢的字节传输时。

select()本身的实现也是有局限的：能打开的文件描述符最多不能超过FD_SETSIZE，很容易耗尽；每次从select()返回的描述符组中扫描就绪的描述符需要时间，如果就绪的描述符在末尾时更是如此（epoll特别彻底修复了这个问题）。

- 多进程服务，使用阻塞IO

也称作 accept/fork 模型，每当有客户连线时产生一个新的进程为之服务。这种方式有时是必要的，比如可以通过操作系统获得良好的内存保护，可以以不同的用户身份运行程序，可以让服务运行在不同的目录下面。但是它的缺点也很明显：进程比较占资源，进程切换开销太大，共享某些信息比较麻烦。Apache 1.3就使用了这种模型，MaxClients数很容易就可以达到。

- 多线程服务，使用阻塞IO

也称之 accept/pthread_create模型，有新客户来时创建一个服务线程而不是服务进程。这解决了多进程服务的一些问题，比如它占用资源少，信息共享方便。但是麻烦在于线程仍有可能消耗光，线程切换也需要开销。

- 混合服务方式

所谓的混合服务方式，以打破服务方和客户方之间严格的1:1关系。基本做法是：

新客户到来时创建新的工作线程，当该工作线程检测到网络IO会有延迟时停止处理过程，返回给Server一个延迟处理状态，同时告诉 Server被延迟的文件描述符，延迟超时时间。Server会在合适的时候返回工作线程继续处理。注意这里的工作线程不是通过 pthread_create()创建的，而是被包装在专门用于处理延迟工作的函数里。

这里还有一个问题，工作线程如何检测网络IO会有延迟？方法有很多，比如设置较短的超时时间调用poll()，或者甚至使用非阻塞IO。如果是套接字，可以设置SO_RCVTIMEO和SO_SNDTIMEO选项，这样更有效率。

除了延迟线程，Server还应提供了未完成线程的支持。

如有有特别耗费时间的操作，你可以在完成部分工作后停止处理，返回给Server一个未完成状态。这样Server会检查工作队列是否有别的线程，如果有则让它们运行，否则让该工作线程继续处理，这可以防止某些线程挨饿。

典型的一个混合服务模型开源实现ServerKit

Serverkit的这些线程支持功能可简化我们的服务程序设计，效率上应该也是有保证的。

2. 队列(queue)

ServerKit提供的队列是一个单向链表，队列的存取是原子操作，如果只有一个执行单元建议不要用，因为原子操作的开销较大。

3. 堆(heap)

malloc()分配内存有一定的局限，比如在多线程的环境里，需要序列化内存分配操作。ServerKit提供的堆管理函数，可快速分配内存，可有效减少分配内存的序列化操作，堆的大小可动态增长，堆有引用计数，这些特征比较适合多线程环境。目前ServerKit堆的最大局限是分配单元必须是固定大小。

4. 日志记录

日志被保存在队列，有一个专门的线程处理队列中的日志记录：它或者调用syslog()写进系统日志，或者通过UDP直接写到远程机器。后者更有效。

5. 读写锁

GNU libc也在pthreads库里实现了读写锁，如果定义了__USE_UNIX98就可以使用。不过ServerKit还提供了读写锁互相转换的函数，这使得锁的应用更为弹性。比如拥有读锁的若干个线程对同一个hash表进行检索，其中一个线程检索到了数据，此时需要修改它，一种办法是获取写锁，但这会导致释放读锁和获取写锁之间存在时间窗，另一种办法是使用ServerKit提供的函数把读锁转换成写锁，无疑这种方式更有效率。

除了以上这些功能，ServerKit还提供了数据库连接池的管理（当前只支持MySQL）和序列化（Sequences），如感兴趣可参见相关的API文档。

二、ServerKit服务模块编写

ServerKit由3部分组成：server程序，负责加载服务模块、解析配置文件、建立数据库连接池；libserver，动态链接库，提供所有功能的库支持，包括server本身也是调用这个库写的；API，编程接口，你编写的服务模块和ServerKit框架进行对话的接口。

ServerKit需要libConfuse解析配置文件，所以出了安装ServerKit，还需要安装libConfuse。关于libConfuse可参考 http://www.nongnu.org/confuse/ 。

下面我们看一个简单的服务模块FOO：

#include <confuse.h>

#include <server.h>

static long int sleep_duration

static int FOO_construct()

{

fprintf(stderr, "FOO_construct\n")

return 1

}

static int FOO_prestart(cfg_t *configuration)

{

fprintf(stderr, "FOO_prestart\n")

return 1

}

static void * FOO_operator(void *foobar)

{

fprintf(stderr, "FOO_operator\n")

for() sleep(sleep_duration)

return NULL

}

static void FOO_report(void)

{

fprintf(stderr, "FOO_report\n")

}

static cfg_opt_t FOO_config[] = {

CFG_SIMPLE_INT("sleep_duration", &sleep_duration),

CFG_END()

}

static char *FOO_authors[] = {"Vito Caputo <vcaputo@pengaru.com>", NULL}

SERVER_MODULE(FOO,0,0,1,"Example module that does nothing but sleep")

按以下方法编译：

$ gcc -c -fPIC -pthread -D_REENTRANT -g FOO.c

$ gcc -shared -lserver -lconfuse -lpthread -g -e __server_module_main -o FOO.so FOO.o

-e选项指定程序运行入口，这使得你可以直接在命令行敲 ./FOO.so 运行模块。

server程序根据环境变量SERVER_PERSONALITY_PATH定位主目录，并查找主目录下的c11n作为配置文件，动态加载的模块需放在主目录下的modules目录。

$ export SERVER_PERSONALITY_PATH=`pwd`

$ mkdir modules

$ cp FOO.so modules

$ vi c11n

c11n的内容：

identity = "any_id"

FOO {

sleep_duration = 1

}

identity标识server实例，用ps可看到程序名称形如server.identity，本例为server.any_id。

执行server启动服务程序。

三、ServerKit其他功能缺陷

缺乏daemon模式；

只能运行在Linux box；

DB pool只支持MySQL；

Heap管理内存的功力有限

并发的意思是指网站在同一时间访问的人数，人数越大，瞬间带宽要求更高。服务器并发量分为：1.业务并发用户数；2.最大并发访问数；3.系统用户数；4.同时在线用户数；

说明服务器实际压力，能承受的最大并发访问数，既取决于业务并发用户数，还取决于用户的业务场景，这些可以通过对服务器日志的分析得到。

一般只需要分析出典型业务（用户常用，最关注的业务操作）

给出一个估算业务并发用户数的公式（测试人员一般只关心业务并发用户数）

C=nL/T

C^=C+3×(C的平方根)

C是平均的业务并发用户数、n是login session的数量、L是login session的平均长度、T是指考察的时间段长度、C^是指业务并发用户数的峰值。

假设OA系统有1000用户，每天400个用户发访问，每个登录到退出平均时间2小时，在1天时间内用户只在8小时内使用该系统。

C=400×2/8=100

C^=100+3×(100的平方根)=100+3×10=130

另外，如果知道平均每个用户发出的请求数u，则系统吞吐量可以估算为u×C

精确估算，还要考虑用户业务操作存在一定的时间集中性（比如上班后1小时内是OA系统高峰期），采用公式计算仍然会存在偏差。

285-104-1346

可以通过消除瓶颈来提高高性能服务器并发量。当能够消除所有的瓶颈时就能够最大的发挥硬件性能，让系统的性能和并发数到达最佳。【感兴趣的话点击此处，免费了解一下】

采用多线程多核编程，使用事件驱动或异步消息机制，尽量减少阻塞和等待操作（如I/O阻塞、同步等待或计时/超时等）。它的原理如下：

1，多线程多核编程，消除cpu瓶颈。

2，采用IOCP或epoll，利用状态监测和通知方式，消除网络I/O阻塞瓶颈。

3，采用事件驱动或异步消息机制，可以消除不必要的等待操作。

4，如果是Linux，可以采用AIO来消除磁盘I/O阻塞瓶颈。

5，在事件驱动框架或异步消息中统一处理timer事件，变同步为异步，而且可以在一个线程处理无数timer事件。

6，深入分析外部的阻塞来源，消除它。比如数据库查询较慢，导致服务器处理较慢，并发数上不去，这时就要优化数据库性能。

7，如果与某个其他server通信量很大，导致性能下降较多。可以考虑把这两个server放在一个主机上，采用共享内存的方式来做IPC通信，可以大大提高性能。

亿万克作为中国战略性新兴产业领军品牌，拥有行业前沿技术，致力于新型数据中心建设，构筑云端安全数字底座，为客户提供集产品研发、生产、部署、运维于一体的服务器及IT系统解决方案业务，产品和技术完全拥有自主知识产权，应用领域涵盖云计算、数据中心、边缘计算、人工智能、金融、电信、教育、能源等，为客户提供全方位安全自主可控技术服务保障。

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/700728.html

网络服务器的几种并发服务模型

发表评论

评论列表（0条）