linux 多进程信号同步问题_服务器知识

朋友你好：希望能帮到你。互相学习。

线程的最大特点是资源的共享性，但资源共享中的同步问题是多线程编程的难点。linux下提供了多种方式来处理线程同步，最常用的是互斥锁、条件变量和信号量。

1）互斥锁（mutex）

通过锁机制实现线程间的同步。同一时刻只允许一个线程执行一个关键部分的代码。

int pthread_mutex_init(pthread_mutex_t *mutex,const pthread_mutex_attr_t *mutexattr)

int pthread_mutex_lock(pthread_mutex *mutex)

int pthread_mutex_destroy(pthread_mutex *mutex)

int pthread_mutex_unlock(pthread_mutex *

(1)先初始化锁init()或静态赋值pthread_mutex_t mutex=PTHREAD_MUTEX_INITIALIER

attr_t有:

PTHREAD_MUTEX_TIMED_NP:其余线程等待队列

PTHREAD_MUTEX_RECURSIVE_NP:嵌套锁,允许线程多次加锁,不同线程,解锁后重新竞争

PTHREAD_MUTEX_ERRORCHECK_NP:检错,与一同,线程请求已用锁,返回EDEADLK

PTHREAD_MUTEX_ADAPTIVE_NP:适应锁,解锁后重新竞争

(2)加锁,lock,trylock,lock阻塞等待锁,trylock立即返回EBUSY

(3)解锁,unlock需满足是加锁状态,且由加锁线程解锁

(4)清除锁,destroy(此时锁必需unlock,否则返回EBUSY,//Linux下互斥锁不占用内存资源

示例代码

#include <cstdio>

#include <cstdlib>

#include <unistd.h>

#include <pthread.h>

#include "iostream"

using namespace std

pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER

int tmp

void* thread(void *arg)

{

cout <<"thread id is " <<pthread_self() <<endl

pthread_mutex_lock(&mutex)

tmp = 12

cout <<"Now a is " <<tmp <<endl

pthread_mutex_unlock(&mutex)

return NULL

}

int main()

{

pthread_t id

cout <<"main thread id is " <<pthread_self() <<endl

tmp = 3

cout <<"In main func tmp = " <<tmp <<endl

if (!pthread_create(&id, NULL, thread, NULL))

{

cout <<"Create thread success!" <<endl

}

else

{

cout <<"Create thread failed!" <<endl

}

pthread_join(id, NULL)

pthread_mutex_destroy(&mutex)

return 0

}

编译： g++ -o thread testthread.cpp -lpthread

说明：pthread库不是Linux系统默认的库，连接时需要使用静态库libpthread.a，所以在使用pthread_create()创建线程，以及调用pthread_atfork()函数建立fork处理程序时，需要链接该库。在编译中要加 -lpthread参数。

2）条件变量（cond）

利用线程间共享的全局变量进行同步的一种机制。条件变量上的基本操作有：触发条件(当条件变为 true 时)；等待条件，挂起线程直到其他线程触发条件。

int pthread_cond_init(pthread_cond_t *cond,pthread_condattr_t *cond_attr)

int pthread_cond_wait(pthread_cond_t *cond,pthread_mutex_t *mutex)

int pthread_cond_timewait(pthread_cond_t *cond,pthread_mutex *mutex,const timespec *abstime)

int pthread_cond_destroy(pthread_cond_t *cond)

int pthread_cond_signal(pthread_cond_t *cond)

int pthread_cond_broadcast(pthread_cond_t *cond) //解除所有线程的阻塞

(1)初始化.init()或者pthread_cond_t cond=PTHREAD_COND_INITIALIER（前者为动态初始化，后者为静态初始化）属性置为NULL

(2)等待条件成立.pthread_wait,pthread_timewait.wait()释放锁,并阻塞等待条件变量为真，timewait()设置等待时间,仍未signal,返回ETIMEOUT(加锁保证只有一个线程wait)

(3)激活条件变量:pthread_cond_signal,pthread_cond_broadcast(激活所有等待线程)

(4)清除条件变量:destroy无线程等待,否则返回EBUSY

对于

int pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex)

int pthread_cond_timedwait(pthread_cond_t *cond, pthread_mutex_t *mutex, const struct timespec *abstime)

一定要在mutex的锁定区域内使用。

如果要正确的使用pthread_mutex_lock与pthread_mutex_unlock，请参考

pthread_cleanup_push和pthread_cleanup_pop宏，它能够在线程被cancel的时候正确的释放mutex！

另外，posix1标准说，pthread_cond_signal与pthread_cond_broadcast无需考虑调用线程是否是mutex的拥有者，也就是说，可以在lock与unlock以外的区域调用。如果我们对调用行为不关心，那么请在lock区域之外调用吧。

说明：

(1)pthread_cond_wait 自动解锁互斥量(如同执行了pthread_unlock_mutex)，并等待条件变量触发。这时线程挂起，不占用CPU时间，直到条件变量被触发（变量为ture）。在调用 pthread_cond_wait之前，应用程序必须加锁互斥量。pthread_cond_wait函数返回前，自动重新对互斥量加锁(如同执行了pthread_lock_mutex)。

(2)互斥量的解锁和在条件变量上挂起都是自动进行的。因此，在条件变量被触发前，如果所有的线程都要对互斥量加锁，这种机制可保证在线程加锁互斥量和进入等待条件变量期间，条件变量不被触发。条件变量要和互斥量相联结，以避免出现条件竞争——个线程预备等待一个条件变量，当它在真正进入等待之前，另一个线程恰好触发了该条件（条件满足信号有可能在测试条件和调用pthread_cond_wait函数（block）之间被发出，从而造成无限制的等待）。

(3)pthread_cond_timedwait 和 pthread_cond_wait 一样，自动解锁互斥量及等待条件变量，但它还限定了等待时间。如果在abstime指定的时间内cond未触发，互斥量mutex被重新加锁，且pthread_cond_timedwait返回错误 ETIMEDOUT。abstime 参数指定一个绝对时间，时间原点与 time 和 gettimeofday 相同：abstime = 0 表示 1970年1月1日00:00:00 GMT。

(4)pthread_cond_destroy 销毁一个条件变量，释放它拥有的资源。进入 pthread_cond_destroy 之前，必须没有在该条件变量上等待的线程。

(5)条件变量函数不是异步信号安全的，不应当在信号处理程序中进行调用。特别要注意，如果在信号处理程序中调用 pthread_cond_signal 或pthread_cond_boardcast 函数，可能导致调用线程死锁。

示例程序1

#include <stdio.h>

#include <pthread.h>

#include "stdlib.h"

#include "unistd.h"

pthread_mutex_t mutex

pthread_cond_t cond

void hander(void *arg)

{

free(arg)

(void)pthread_mutex_unlock(&mutex)

}

void *thread1(void *arg)

{

pthread_cleanup_push(hander, &mutex)

while(1)

{

printf("thread1 is running\n")

pthread_mutex_lock(&mutex)

pthread_cond_wait(&cond,&mutex)

printf("thread1 applied the condition\n")

pthread_mutex_unlock(&mutex)

sleep(4)

}

pthread_cleanup_pop(0)

}

void *thread2(void *arg)

{

while(1)

{

printf("thread2 is running\n")

pthread_mutex_lock(&mutex)

pthread_cond_wait(&cond,&mutex)

printf("thread2 applied the condition\n")

pthread_mutex_unlock(&mutex)

sleep(1)

}

int main()

{

pthread_t thid1,thid2

printf("condition variable study!\n")

pthread_mutex_init(&mutex,NULL)

pthread_cond_init(&cond,NULL)

pthread_create(&thid1,NULL,thread1,NULL)

pthread_create(&thid2,NULL,thread2,NULL)

sleep(1)

{

pthread_cond_signal(&cond)

}while(1)

sleep(20)

pthread_exit(0)

return 0

}

示例程序2：

#include <pthread.h>

#include <unistd.h>

#include "stdio.h"

#include "stdlib.h"

static pthread_mutex_t mtx = PTHREAD_MUTEX_INITIALIZER

static pthread_cond_t cond = PTHREAD_COND_INITIALIZER

struct node

{

int n_number

struct node *n_next

} *head = NULL

/*[thread_func]*/

static void cleanup_handler(void *arg)

{

printf("Cleanup handler of second thread./n")

free(arg)

(void)pthread_mutex_unlock(&mtx)

}

static void *thread_func(void *arg)

{

struct node *p = NULL

pthread_cleanup_push(cleanup_handler, p)

while (1)

{

//这个mutex主要是用来保证pthread_cond_wait的并发性

pthread_mutex_lock(&mtx)

while (head == NULL)

{

//这个while要特别说明一下，单个pthread_cond_wait功能很完善，为何

//这里要有一个while (head == NULL)呢？因为pthread_cond_wait里的线

//程可能会被意外唤醒，如果这个时候head != NULL，则不是我们想要的情况。

//这个时候，应该让线程继续进入pthread_cond_wait

// pthread_cond_wait会先解除之前的pthread_mutex_lock锁定的mtx，

//然后阻塞在等待对列里休眠，直到再次被唤醒（大多数情况下是等待的条件成立

//而被唤醒，唤醒后，该进程会先锁定先pthread_mutex_lock(&mtx)，再读取资源

//用这个流程是比较清楚的/*block-->unlock-->wait() return-->lock*/

pthread_cond_wait(&cond, &mtx)

p = head

head = head->n_next

printf("Got %d from front of queue/n", p->n_number)

free(p)

}

pthread_mutex_unlock(&mtx)//临界区数据操作完毕，释放互斥锁

}

pthread_cleanup_pop(0)

return 0

}

int main(void)

{

pthread_t tid

int i

struct node *p

//子线程会一直等待资源，类似生产者和消费者，但是这里的消费者可以是多个消费者，而

//不仅仅支持普通的单个消费者，这个模型虽然简单，但是很强大

pthread_create(&tid, NULL, thread_func, NULL)

sleep(1)

for (i = 0i <10i++)

{

p = (struct node*)malloc(sizeof(struct node))

p->n_number = i

pthread_mutex_lock(&mtx)//需要操作head这个临界资源，先加锁，

p->n_next = head

head = p

pthread_cond_signal(&cond)

pthread_mutex_unlock(&mtx)//解锁

sleep(1)

}

printf("thread 1 wanna end the line.So cancel thread 2./n")

//关于pthread_cancel，有一点额外的说明，它是从外部终止子线程，子线程会在最近的取消点，退出

//线程，而在我们的代码里，最近的取消点肯定就是pthread_cond_wait()了。

pthread_cancel(tid)

pthread_join(tid, NULL)

printf("All done -- exiting/n")

return 0

}

3）信号量

如同进程一样，线程也可以通过信号量来实现通信，虽然是轻量级的。

信号量函数的名字都以"sem_"打头。线程使用的基本信号量函数有四个。

#include <semaphore.h>

int sem_init (sem_t *sem , int pshared, unsigned int value)

这是对由sem指定的信号量进行初始化，设置好它的共享选项（linux 只支持为0，即表示它是当前进程的局部信号量），然后给它一个初始值VALUE。

两个原子操作函数：

int sem_wait(sem_t *sem)

int sem_post(sem_t *sem)

这两个函数都要用一个由sem_init调用初始化的信号量对象的指针做参数。

sem_post：给信号量的值加1；

sem_wait:给信号量减1；对一个值为0的信号量调用sem_wait,这个函数将会等待直到有其它线程使它不再是0为止。

int sem_destroy(sem_t *sem)

这个函数的作用是再我们用完信号量后都它进行清理。归还自己占有的一切资源。

示例代码：

#include <stdlib.h>

#include <stdio.h>

#include <unistd.h>

#include <pthread.h>

#include <semaphore.h>

#include <errno.h>

#define return_if_fail(p) if((p) == 0){printf ("[%s]:func error!/n", __func__)return}

typedef struct _PrivInfo

{

sem_t s1

sem_t s2

time_t end_time

}PrivInfo

static void info_init (PrivInfo* thiz)

static void info_destroy (PrivInfo* thiz)

static void* pthread_func_1 (PrivInfo* thiz)

static void* pthread_func_2 (PrivInfo* thiz)

int main (int argc, char** argv)

{

pthread_t pt_1 = 0

pthread_t pt_2 = 0

int ret = 0

PrivInfo* thiz = NULL

thiz = (PrivInfo* )malloc (sizeof (PrivInfo))

if (thiz == NULL)

{

printf ("[%s]: Failed to malloc priv./n")

return -1

}

info_init (thiz)

ret = pthread_create (&pt_1, NULL, (void*)pthread_func_1, thiz)

if (ret != 0)

{

perror ("pthread_1_create:")

}

ret = pthread_create (&pt_2, NULL, (void*)pthread_func_2, thiz)

if (ret != 0)

{

perror ("pthread_2_create:")

}

pthread_join (pt_1, NULL)

pthread_join (pt_2, NULL)

info_destroy (thiz)

return 0

}

static void info_init (PrivInfo* thiz)

{

return_if_fail (thiz != NULL)

thiz->end_time = time(NULL) + 10

sem_init (&thiz->s1, 0, 1)

sem_init (&thiz->s2, 0, 0)

return

}

static void info_destroy (PrivInfo* thiz)

{

return_if_fail (thiz != NULL)

sem_destroy (&thiz->s1)

sem_destroy (&thiz->s2)

free (thiz)

thiz = NULL

return

}

static void* pthread_func_1 (PrivInfo* thiz)

{

return_if_fail (thiz != NULL)

while (time(NULL) <thiz->end_time)

{

sem_wait (&thiz->s2)

printf ("pthread1: pthread1 get the lock./n")

sem_post (&thiz->s1)

printf ("pthread1: pthread1 unlock/n")

sleep (1)

}

return

}

static void* pthread_func_2 (PrivInfo* thiz)

{

return_if_fail (thiz != NULL)

while (time (NULL) <thiz->end_time)

{

sem_wait (&thiz->s1)

printf ("pthread2: pthread2 get the unlock./n")

sem_post (&thiz->s2)

printf ("pthread2: pthread2 unlock./n")

sleep (1)

}

return

}

通过执行结果后，可以看出，会先执行线程二的函数，然后再执行线程一的函数。它们两就实现了同步

Linux系统中，实现线程同步的方式大致分为六种，其中包括：互斥锁、自旋锁、信号量、条件变量、读写锁、屏障。最常用的线程同步方式就是互斥锁、自旋锁、信号量：

1、互斥锁

互斥锁本质就是一个特殊的全局变量，拥有lock和unlock两种状态，unlock的互斥锁可以由某个线程获得，当互斥锁由某个线程持有后，这个互斥锁会锁上变成lock状态，此后只有该线程有权力打开该锁，其他想要获得该互斥锁的线程都会阻塞，直到互斥锁被解锁。

互斥锁的类型：

①普通锁：互斥锁默认类型。当一个线程对一个普通锁加锁以后，其余请求该锁的线程将形成一个等待队列，并在锁解锁后按照优先级获得它，这种锁类型保证了资源分配的公平性。一个线程如果对一个已经加锁的普通锁再次加锁，将引发死锁对一个已经被其他线程加锁的普通锁解锁，或者对一个已经解锁的普通锁再次解锁，将导致不可预期的后果。

②检错锁：一个线程如果对一个已经加锁的检错锁再次加锁，则加锁操作返回EDEADLK对一个已经被其他线程加锁的检错锁解锁或者对一个已经解锁的检错锁再次解锁，则解锁操作返回EPERM。

③嵌套锁：该锁允许一个线程在释放锁之前多次对它加锁而不发生死锁其他线程要获得这个锁，则当前锁的拥有者必须执行多次解锁操作对一个已经被其他线程加锁的嵌套锁解锁，或者对一个已经解锁的嵌套锁再次解锁，则解锁操作返回EPERM。

④默认锁：一个线程如果对一个已经解锁的默认锁再次加锁，或者对一个已经被其他线程加锁的默认锁解锁，或者对一个解锁的默认锁解锁，将导致不可预期的后果这种锁实现的时候可能被映射成上述三种锁之一。

【老男孩教育】Linux运维云计算课程汇集了虚拟化、云计算、安全攻防、Python开发、SRE等技术，课堂效率高、内容丰富全面，由浅入深，循序渐进，帮助学员稳扎稳打，夯实基础，在有限的时间内帮助学员高效提升，成为符合企业需求的技术型人才。

2、自旋锁

自旋锁顾名思义就是一个死循环，不停的轮询，当一个线程未获得自旋锁时，不会像互斥锁一样进入阻塞休眠状态，而是不停的轮询获取锁，如果自旋锁能够很快被释放，那么性能就会很高，如果自旋锁长时间不能够被释放，甚至里面还有大量的IO阻塞，就会导致其他获取锁的线程一直空轮询，导致CPU使用率达到100%，特别CPU时间。

3、信号量

信号量是一个计数器，用于控制访问有限共享资源的线程数。

信号量是包含一个非负整数型的变量，并且带有两个原子操作wait和signal。Wait还可以被称为down、P或lock，signal还可以被称为up、V、unlock或post。在UNIX的API中（POSIX标准）用的是wait和post。

对于wait操作，如果信号量的非负整形变量S大于0，wait就将其减1，如果S等于0，wait就将调用线程阻塞；对于post操作，如果有线程在信号量上阻塞（此时S等于0），post就会解除对某个等待线程的阻塞，使其从wait中返回，如果没有线程阻塞在信号量上，post就将S加1.

由此可见，S可以被理解为一种资源的数量，信号量即是通过控制这种资源的分配来实现互斥和同步的。如果把S设为1，那么信号量即可使多线程并发运行。另外，信号量不仅允许使用者申请和释放资源，而且还允许使用者创造资源，这就赋予了信号量实现同步的功能。可见信号量的功能要比互斥量丰富许多。

POSIX信号量是一个sem_t类型的变量，但POSIX有两种信号量的实现机制： 无名信号量 和 命名信号量 。无名信号量只可以在共享内存的情况下，比如实现进程中各个线程之间的互斥和同步，因此无名信号量也被称作基于内存的信号量；命名信号量通常用于不共享内存的情况下，比如进程间通信。

同时，在创建信号量时，根据信号量取值的不同，POSIX信号量还可以分为：

下面是POSIX信号量函数接口：

信号量的函数都以sem_开头，线程中使用的基本信号函数有4个，他们都声明在头文件semaphore.h中，该头文件定义了用于信号量操作的sem_t类型：

【sem_init函数】：

该函数用于创建信号量，原型如下：

该函数初始化由sem指向的信号对象，设置它的共享选项，并给它一个初始的整数值。pshared控制信号量的类型，如果其值为0，就表示信号量是当前进程的局部信号量，否则信号量就可以在多个进程间共享，value为sem的初始值。

该函数调用成功返回0，失败返回-1。

【sem_destroy函数】：

该函数用于对用完的信号量进行清理，其原型如下：

成功返回0，失败返回-1。

【sem_wait函数】：

该函数用于以原子操作的方式将信号量的值减1。原子操作就是，如果两个线程企图同时给一个信号量加1或减1，它们之间不会互相干扰。其原型如下：

sem指向的对象是sem_init调用初始化的信号量。调用成功返回0，失败返回-1。

sem_trywait()则是sem_wait()的非阻塞版本，当条件不满足时（信号量为0时），该函数直接返回EAGAIN错误而不会阻塞等待。

sem_timedwait()功能与sem_wait()类似，只是在指定的abs_timeout时间内等待，超过时间则直接返回ETIMEDOUT错误。

【sem_post函数】：

该函数用于以原子操作的方式将信号量的值加1，其原型如下：

与sem_wait一样，sem指向的对象是由sem_init调用初始化的信号量。调用成功时返回0，失败返回-1。

【sem_getvalue函数】：

该函数返回当前信号量的值，通过restrict输出参数返回。如果当前信号量已经上锁（即同步对象不可用），那么返回值为0，或为负数，其绝对值就是等待该信号量解锁的线程数。

【实例1】：

【实例2】：

之所以称为命名信号量，是因为它有一个名字、一个用户ID、一个组ID和权限。这些是提供给不共享内存的那些进程使用命名信号量的接口。命名信号量的名字是一个遵守路径名构造规则的字符串。

【sem_open函数】：

该函数用于创建或打开一个命名信号量，其原型如下：

参数name是一个标识信号量的字符串。参数oflag用来确定是创建信号量还是连接已有的信号量。

oflag的参数可以为0，O_CREAT或O_EXCL：如果为0，表示打开一个已存在的信号量；如果为O_CREAT，表示如果信号量不存在就创建一个信号量，如果存在则打开被返回，此时mode和value都需要指定；如果为O_CREAT|O_EXCL，表示如果信号量存在则返回错误。

mode参数用于创建信号量时指定信号量的权限位，和open函数一样，包括：S_IRUSR、S_IWUSR、S_IRGRP、S_IWGRP、S_IROTH、S_IWOTH。

value表示创建信号量时，信号量的初始值。

【sem_close函数】：

该函数用于关闭命名信号量：

单个程序可以用sem_close函数关闭命名信号量，但是这样做并不能将信号量从系统中删除，因为命名信号量在单个程序执行之外是具有持久性的。当进程调用_exit、exit、exec或从main返回时，进程打开的命名信号量同样会被关闭。

【sem_unlink函数】：

sem_unlink函数用于在所有进程关闭了命名信号量之后，将信号量从系统中删除：

【信号量操作函数】：

与无名信号量一样，操作信号量的函数如下:

命名信号量是随内核持续的。当命名信号量创建后，即使当前没有进程打开某个信号量，它的值依然保持，直到内核重新自举或调用sem_unlink()删除该信号量。

无名信号量的持续性要根据信号量在内存中的位置确定：

很多时候信号量、互斥量和条件变量都可以在某种应用中使用，那这三者的差异有哪些呢？下面列出了这三者之间的差异：

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/138157.html

linux 多进程信号同步问题

发表评论

评论列表（0条）