Linux信号量_服务器知识

信号量是包含一个非负整数型的变量，并且带有两个原子操作wait和signal。Wait还可以被称为down、P或lock，signal还可以被称为up、V、unlock或post。在UNIX的API中（POSIX标准）用的是wait和post。

对于wait操作，如果信号量的非负整形变量S大于0，wait就将其减1，如果S等于0，wait就将调用线程阻塞；对于post操作，如果有线程在信号量上阻塞（此时S等于0），post就会解除对某个等待线程的阻塞，使其从wait中返回，如果没有线程阻塞在信号量上，post就将S加1.

由此可见，S可以被理解为一种资源的数量，信号量即是通过控制这种资源的分配来实现互斥和同步的。如果把S设为1，那么信号量即可使多线程并发运行。另外，信号量不仅允许使用者申请和释放资源，而且还允许使用者创造资源，这就赋予了信号量实现同步的功能。可见信号量的功能要比互斥量丰富许多。

POSIX信号量是一个sem_t类型的变量，但POSIX有两种信号量的实现机制： 无名信号量 和 命名信号量 。无名信号量只可以在共享内存的情况下，比如实现进程中各个线程之间的互斥和同步，因此无名信号量也被称作基于内存的信号量；命名信号量通常用于不共享内存的情况下，比如进程间通信。

同时，在创建信号量时，根据信号量取值的不同，POSIX信号量还可以分为：

下面是POSIX信号量函数接口：

信号量的函数都以sem_开头，线程中使用的基本信号函数有4个，他们都声明在头文件semaphore.h中，该头文件定义了用于信号量操作的sem_t类型：

【sem_init函数】：

该函数用于创建信号量，原型如下：

该函数初始化由sem指向的信号对象，设置它的共享选项，并给它一个初始的整数值。pshared控制信号量的类型，如果其值为0，就表示信号量是当前进程的局部信号量，否则信号量就可以在多个进程间共享，value为sem的初始值。

该函数调用成功返回0，失败返回-1。

【sem_destroy函数】：

该函数用于对用完的信号量进行清理，其原型如下：

成功返回0，失败返回-1。

【sem_wait函数】：

该函数用于以原子操作的方式将信号量的值减1。原子操作就是，如果两个线程企图同时给一个信号量加1或减1，它们之间不会互相干扰。其原型如下：

sem指向的对象是sem_init调用初始化的信号量。调用成功返回0，失败返回-1。

sem_trywait()则是sem_wait()的非阻塞版本，当条件不满足时（信号量为0时），该函数直接返回EAGAIN错误而不会阻塞等待。

sem_timedwait()功能与sem_wait()类似，只是在指定的abs_timeout时间内等待，超过时间则直接返回ETIMEDOUT错误。

【sem_post函数】：

该函数用于以原子操作的方式将信号量的值加1，其原型如下：

与sem_wait一样，sem指向的对象是由sem_init调用初始化的信号量。调用成功时返回0，失败返回-1。

【sem_getvalue函数】：

该函数返回当前信号量的值，通过restrict输出参数返回。如果当前信号量已经上锁（即同步对象不可用），那么返回值为0，或为负数，其绝对值就是等待该信号量解锁的线程数。

【实例1】：

【实例2】：

之所以称为命名信号量，是因为它有一个名字、一个用户ID、一个组ID和权限。这些是提供给不共享内存的那些进程使用命名信号量的接口。命名信号量的名字是一个遵守路径名构造规则的字符串。

【sem_open函数】：

该函数用于创建或打开一个命名信号量，其原型如下：

参数name是一个标识信号量的字符串。参数oflag用来确定是创建信号量还是连接已有的信号量。

oflag的参数可以为0，O_CREAT或O_EXCL：如果为0，表示打开一个已存在的信号量；如果为O_CREAT，表示如果信号量不存在就创建一个信号量，如果存在则打开被返回，此时mode和value都需要指定；如果为O_CREAT|O_EXCL，表示如果信号量存在则返回错误。

mode参数用于创建信号量时指定信号量的权限位，和open函数一样，包括：S_IRUSR、S_IWUSR、S_IRGRP、S_IWGRP、S_IROTH、S_IWOTH。

value表示创建信号量时，信号量的初始值。

【sem_close函数】：

该函数用于关闭命名信号量：

单个程序可以用sem_close函数关闭命名信号量，但是这样做并不能将信号量从系统中删除，因为命名信号量在单个程序执行之外是具有持久性的。当进程调用_exit、exit、exec或从main返回时，进程打开的命名信号量同样会被关闭。

【sem_unlink函数】：

sem_unlink函数用于在所有进程关闭了命名信号量之后，将信号量从系统中删除：

【信号量操作函数】：

与无名信号量一样，操作信号量的函数如下:

命名信号量是随内核持续的。当命名信号量创建后，即使当前没有进程打开某个信号量，它的值依然保持，直到内核重新自举或调用sem_unlink()删除该信号量。

无名信号量的持续性要根据信号量在内存中的位置确定：

很多时候信号量、互斥量和条件变量都可以在某种应用中使用，那这三者的差异有哪些呢？下面列出了这三者之间的差异：

（1）Posix标准中有有名信号灯和无名信号灯之分，对于有名信号灯，可以用sem_open来创建，其prototype是:

sem_t *sem_open(const char *name, int oflag)//打开已有的信号灯

sem_t *sem_open(const char *name, int oflag, mode_t mode, unsigned value)//一般是创建信号灯。

期中name是信号灯的名字， oflag是0, O_CREAT 或者 O_CREAT | O_EXCL, 如果指定O_CREAT，那么mode和value对应创建该信号的模式和初始值。如果指定了O_EXCL, 而且该信号灯已经在系统中存在，那调用会出错返回SEM_FAILED常量。对于Linux内核来说，有名信号灯是很晚才加入内核中的，创建或是打开有名信号时候，应该指定”/semname“名字，对应的信号灯创建在/dev/shm目录下，名字是/dev/shm/sem.semname. BTW, 用gcc/g++编译实用信号灯功能的程序时候，应该引用librt库，（e.g., g++ -lrt sem.cpp). 关闭已打开的信号灯，用sem_close(sem_t *sem). 关闭信号灯并不意味着系统会删除它，要删除一个信号灯，需要调用sem_unlink(sem_t *sem)。有名信号灯一般是为了进程之间同步实用的。无名信号灯，一般是为一个进程内的不同线程之间同步使用的。创建无名信号灯的方法如下：

sem_t sem

sem_init(&sem, int shared, unsigned int value)//初始化信号灯。

......

sem_destroy(&sem)//清除信号灯。

（2）信号灯的使用和状态。

信号灯一般用来描述不同线程所共享的公共资源的数量，每一个信号灯都有一个叫做信号量的非负整数与之相连；信号量一般代表公共资源的数目，比如空闲列表中的缓冲区数目，视频中读入帧的数目，等等。对于一个线程可以用sem_wait, sem_post函数来改变一个信号灯的信号量。

sem_wait(sem_t &sem)

sem_wait的语义如下：

{

while(信号量==0)

等待； //此处线程被挂起，等待其他线程调用sem_post唤醒之。

信号量减1；

}

注意：测试信号量是否为零，和减一的操作是原子的，也就是说期间不会发生线程切换。

与sem_wait对应的调用是sem_post,语义如下：

{

信号量加1；

唤醒等待该信号量的线程；//调用sem_wait并等待的线程。

}

该操作也是原子的。

信号灯的状态可以用sem_getvalue来查看。一般来说sem_wait和sem_post的调用不必在同一个线程内成对出现（象mutex那样，lock/unlock要配对出现）。一般的情形是这样的，一个线程等待资源可用，调用sem_wait, 另外一个线程生成资源，然后调用sem_post，唤醒等待该资源的线程。因为信号灯所描述的是线程间公共资源，使用的时候一般和mutex一起使用，mutex保证访问公共资源的线程排他性，信号灯表示资源的可用性。

援引CU上一篇帖子的内容：

“信号量用在多线程多任务同步的，一个线程完成了某一个动作就通过信号量告诉别的线程，别的线程再进行某些动作（大家都在semtake的时候，就阻塞在哪里）。而互斥锁是用在多线程多任务互斥的，一个线程占用了某一个资源，那么别的线程就无法访问，直到这个线程unlock，其他的线程才开始可以利用这个资源。比如对全局变量的访问，有时要加锁，操作完了，在解锁。有的时候锁和信号量会同时使用的”

也就是说，信号量不一定是锁定某一个资源，而是流程上的概念，比如：有A,B两个线程，B线程要等A线程完成某一任务以后再进行自己下面的步骤，这个任务并不一定是锁定某一资源，还可以是进行一些计算或者数据处理之类。而线程互斥量则是“锁住某一资源”的概念，在锁定期间内，其他线程无法对被保护的数据进行操作。在有些情况下两者可以互换。

两者之间的区别:

作用域

信号量: 进程间或线程间(linux仅线程间)

互斥锁: 线程间

上锁时

信号量: 只要信号量的value大于0，其他线程就可以sem_wait成功，成功后信号量的value减一。若value值不大于0，则sem_wait阻塞，直到sem_post释放后value值加一

互斥锁: 只要被锁住，其他任何线程都不可以访问被保护的资源

成功后否则就阻塞

以下是信号灯（量)的一些概念:

信号灯与互斥锁和条件变量的主要不同在于”灯”的概念，灯亮则意味着资源可用，灯灭则意味着不可用。如果说后两中同步方式侧重于”等待”操作，即资源不可用的话，信号灯机制则侧重于点灯，即告知资源可用；没有等待线程的解锁或激发条件都是没有意义的，而没有等待灯亮的线程的点灯操作则有效，且能保持灯亮状态。当然，这样的操作原语也意味着更多的开销。

信号灯的应用除了灯亮/灯灭这种二元灯以外，也可以采用大于1的灯数，以表示资源数大于1，这时可以称之为多元灯。

1．创建和注销

POSIX信号灯标准定义了有名信号灯和无名信号灯两种，但LinuxThreads的实现仅有无名灯，同时有名灯除了总是可用于多进程之间以外，在使用上与无名灯并没有很大的区别，因此下面仅就无名灯进行讨论。

int sem_init(sem_t *sem, int pshared, unsigned int value)

这是创建信号灯的API，其中value为信号灯的初值，pshared表示是否为多进程共享而不仅仅是用于一个进程。LinuxThreads没有实现多进程共享信号灯，因此所有非0值的pshared输入都将使sem_init()返回-1，且置errno为ENOSYS。初始化好的信号灯由sem变量表征，用于以下点灯、灭灯操作。

int sem_destroy(sem_t * sem)

被注销的信号灯sem要求已没有线程在等待该信号灯，否则返回-1，且置errno为EBUSY。除此之外，LinuxThreads的信号灯注销函数不做其他动作。

2．点灯和灭灯

int sem_post(sem_t * sem)

点灯操作将信号灯值原子地加1，表示增加一个可访问的资源。

int sem_wait(sem_t * sem)

int sem_trywait(sem_t * sem)

sem_wait()为等待灯亮操作，等待灯亮（信号灯值大于0），然后将信号灯原子地减1，并返回。sem_trywait()为sem_wait()的非阻塞版，如果信号灯计数大于0，则原子地减1并返回0，否则立即返回-1，errno置为EAGAIN。

3．获取灯值

int sem_getvalue(sem_t * sem, int * sval)

读取sem中的灯计数，存于*sval中，并返回0。

4．其他

sem_wait()被实现为取消点，而且在支持原子”比较且交换”指令的体系结构上，sem_post()是唯一能用于异步信号处理函数的POSIX异步信号安全的API。

----------------------------

线程同步：何时互斥锁不够，还需要条件变量?

假设有共享的资源sum,与之相关联的mutex 是lock_s.假设每个线程对sum的操作很简单的,与sum的状态无关,比如只是sum++.那么只用mutex足够了.程序员只要确保每个线程操作前,取得lock,然后sum++,再unlock即可.每个线程的代码将像这样

add()

{

pthread_mutex_lock(lock_s)

sum++

pthread_mutex_unlock(lock_s)

}

如果操作比较复杂,假设线程t0,t1,t2的操作是sum++,而线程t3则是在sum到达100的时候,打印出一条信息,并对sum清零. 这种情况下,如果只用mutex, 则t3需要一个循环,每个循环里先取得lock_s,然后检查sum的状态,如果sum>=100,则打印并清零,然后unlock.如果sum&lt100,则unlock,并sleep()本线程合适的一段时间.

这个时候,t0,t1,t2的代码不变,t3的代码如下

print()

{

while (1)

{

pthread_mutex_lock(lock_s)

if(sum<100)

{

printf(“sum reach 100!”)

pthread_mutex_unlock(lock_s)

}

else

{

pthread_mutex_unlock(lock_s)

my_thread_sleep(100)

return OK

}

这种办法有两个问题

1) sum在大多数情况下不会到达100,那么对t3的代码来说,大多数情况下,走的是else分支,只是lock和unlock,然后sleep().这浪费了CPU处理时间.

2) 为了节省CPU处理时间,t3会在探测到sum没到达100的时候sleep()一段时间.这样却又带来另外一个问题,亦即t3响应速度下降.可能在sum到达200的时候,t4才会醒过来.

3) 这样,程序员在设置sleep()时间的时候陷入两难境地,设置得太短了节省不了资源,太长了又降低响应速度.真是难办啊!

这个时候,condition variable内裤外穿,从天而降,拯救了焦头烂额的你.

你首先定义一个condition variable.

pthread_cond_t cond_sum_ready=PTHREAD_COND_INITIALIZER

t0,t1,t2的代码只要后面加两行,像这样

add()

{

pthread_mutex_lock(lock_s)

sum++

pthread_mutex_unlock(lock_s)

if(sum>=100)

pthread_cond_signal(&cond_sum_ready)

}

而t3的代码则是

{

pthread_mutex_lock(lock_s)

while(sum<100)

pthread_cond_wait(&cond_sum_ready, &lock_s)

printf(“sum is over 100!”)

sum=0

pthread_mutex_unlock(lock_s)

return OK

}

注意两点:

1) 在thread_cond_wait()之前,必须先lock相关联的mutex, 因为假如目标条件未满足,pthread_cond_wait()实际上会unlock该mutex, 然后block,在目标条件满足后再重新lock该mutex, 然后返回.

2) 为什么是while(sum<100),而不是if(sum<100) ?这是因为在pthread_cond_signal()和pthread_cond_wait()返回之间,有时间差,假设在这个时间差内,还有另外一个线程t4又把sum减少到100以下了,那么t3在pthread_cond_wait()返回之后,显然应该再检查一遍sum的大小.这就是用 while的用意

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/291242.html

Linux信号量

发表评论

评论列表（0条）