【Linux Server】三、Linux多线程开发

2021/12/6 7:18:46

编程Tag： 线程互斥多线程 int server linux SEM pthread mutex

本文主要是介绍【Linux Server】三、Linux多线程开发，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

三、Linux多线程开发

线程概述

与进程（process）类似，线程（thread）是允许应用程序并发执行多个任务的一种机制。一个进程可以包含多个线程。同一个程序中的所有线程均会独立执行相同程序，且共享同一份全局内存区域，其中包括初始化数据段、未初始化数据段，以及堆内存段。（传统意义上的 UNIX 进程只是多线程程序的一个特例，该进程只包含一个线程）
进程是 CPU 分配资源的最小单位，线程是操作系统调度执行的最小单位。
线程是轻量级的进程（LWP：Light Weight Process），在 Linux 环境下线程的本质仍是进程。
查看指定进程的 LWP 号：ps –Lf pid(进程号)

2.线程和进程区别

进程间的信息难以共享。由于除去只读代码段外，父子进程并未共享内存，因此必须采用一些进程间通信方式，在进程间进行信息交换。
调用 fork() 来创建进程的代价相对较高，即便利用写时复制技术，仍然需要复制诸如内存页表和文件描述符表之类的多种进程属性，这意味着 fork() 调用在时间上的开销依然不菲。
线程之间能够方便、快速地共享信息。只需将数据复制到共享（全局或堆）变量中即可。
创建线程比创建进程通常要快 10 倍甚至更多。线程间是共享虚拟地址空间的，无需采用写时复制来复制内存，也无需复制页表。

3.线程之间共享和非共享资源

共享资源
- 进程 ID 和父进程 ID
- 进程组 ID 和会话 ID
- 用户 ID 和用户组 ID
- 文件描述符表
- 信号处置
- 文件系统的相关信息：文件权限掩码（umask）、当前工作目录
- 虚拟地址空间（除栈、.text代码段）
非共享资源
- 线程 ID
- 信号掩码-阻塞信号集
- 线程特有数据
- error 变量
- 实时调度策略和优先级
- 栈，本地变量和函数的调用链接信息

4.查看当前 pthread 库版本：getconf GNU_LIBPTHREAD_VERSION

5.一般情况下,main函数所在的线程我们称之为主线程（main线程），其余创建的线程称之为子线程。
程序中默认只有一个进程，fork()函数调用后，2个进程。
程序中默认只有一个线程，pthread_create()函数调用后，2个线程。

6.线程操作

查看帮助文档man ppthread_create
编译的时候要加上 -lpthread 链接线程库。
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
- 功能：创建一个子线程
- thread：传出参数，线程创建成功后，子线程的线程ID被写到该变量中。
- attr : 设置线程的属性，一般使用默认值，NULL
- start_routine : 函数指针，这个函数是子线程需要处理的逻辑代码
- arg : 给第三个参数使用，传参
- 返回值：
  成功：0；失败：返回错误号。这个错误号和之前errno不太一样。
  获取错误号的信息： char * strerror(int errnum);

void* callback(void* arg)
{
    printf("arg value: %d\n", *(int *)arg);
    return NULL;
}
pthread_t tid;
int num = 10;
int ret = pthread_create(&tid, NULL, callback, (void *)&num);

pthread_t pthread_self(void);
- 功能：获取当前线程的线程ID
int pthread_equal(pthread_t t1, pthread_t t2);
- 功能：比较两个线程ID是否相等。不同的操作系统，pthread_t类型的实现不一样，有的是无符号的长整型，有的是使用结构体去实现的。
void pthread_exit(void *retval);
- 功能：终止一个线程，在哪个线程中调用，就表示终止哪个线程
- retval:需要传递一个指针，作为一个返回值，可以在pthread_join()中获取到。
- 当主线程退出时，不会影响其他正常运行的线程。比如在main函数return 0之前执行pthread_exit(NULL)退出主线程，则return 0不会被执行。而执行return 0的话，子线程也会退出。
int pthread_join(pthread_t thread, void **retval);
- 功能：和一个已经终止的线程进行连接。回收子线程的资源。这个函数是阻塞函数，调用一次只能回收一个子线程。一般在主线程中使用。
- thread：需要回收的子线程的ID
- retval: 接收子线程退出时的返回值(注意这个参数是二级指针)
- 返回值：0 : 成功；非0 : 失败，返回的错误号
int pthread_detach(pthread_t thread);
- 功能：分离一个线程。被分离的线程在终止的时候，会自动释放资源返回给系统。
- thread：需要分离的线程的ID
- 返回值：成功：0；失败：返回错误号。
- 不能多次分离，会产生不可预料的行为。
- 不能去连接(pthread_join)一个已经分离的线程，会报错。
int pthread_cancel(pthread_t thread);
- 功能：取消线程（让线程终止）。
- 取消某个线程，可以终止某个线程的运行，但是并不是立马终止，而是当子线程执行到一个取消点，线程才会终止。
- 取消点：系统规定好的一些系统调用，我们可以粗略的理解为从用户区到内核区的切换，这个位置称之为取消点。

7.线程属性

线程属性类型 pthread_attr_t
int pthread_attr_init(pthread_attr_t *attr);
- 初始化线程属性变量
int pthread_attr_destroy(pthread_attr_t *attr);
- 释放线程属性的资源
int pthread_attr_getdetachstate(const pthread_attr_t *attr, int *detachstate);
- 获取线程分离的状态属性
int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate);
- 设置线程分离的状态属性
可以通过命令查看线程属性的函数 man pthread_attr_两次tab键

8.线程同步

线程的主要优势在于，能够通过全局变量来共享信息。不过，这种便捷的共享是有代价的：必须确保多个线程不会同时修改同一变量，或者某一线程不会读取正在由其他线程修改的变量。
临界区是指访问某一共享资源的代码片段，并且这段代码的执行应为原子操作，也就是同时访问同一共享资源的其他线程不应终端该片段的执行。
线程同步：即当有一个线程在对内存进行操作时，其他线程都不可以对这个内存地址进行操作，直到该线程完成操作，其他线程才能对该内存地址进行操作，而其他线程则处于等待状态。

9.互斥量

为避免线程更新共享变量时出现问题，可以使用互斥量（mutex 是 mutual exclusion的缩写）来确保同时仅有一个线程可以访问某项共享资源。可以使用互斥量来保证对任意共享资源的原子访问。
互斥量有两种状态：已锁定（locked）和未锁定（unlocked）。任何时候，至多只有一个线程可以锁定该互斥量。试图对已经锁定的某一互斥量再次加锁，将可能阻塞线程或者报错失败，具体取决于加锁时使用的方法。
一旦线程锁定互斥量，随即成为该互斥量的所有者，只有所有者才能给互斥量解锁。一般情况下，对每一共享资源（可能由多个相关变量组成）会使用不同的互斥量，每一线程在访问同一资源时将采用如下协议：
- 针对共享资源锁定互斥量
- 访问共享资源
- 对互斥量解锁
如果多个线程试图执行这一块代码（一个临界区），事实上只有一个线程能够持有该互斥量（其他线程将遭到阻塞），即同时只有一个线程能够进入这段代码区域，

10.互斥量相关操作函数

互斥量的类型 pthread_mutex_t
int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr);
- 初始化互斥量
- mutex ：需要初始化的互斥量变量
- attr ：互斥量相关的属性，一般用NULL
- restrict : C语言的修饰符，被修饰的指针，不能由另外的一个指针进行操作。例如：
  pthread_mutex_t *restrict mutex = xxx;
  pthread_mutex_t * mutex1 = mutex; // 用mutex1操作xxx，会报错
int pthread_mutex_destroy(pthread_mutex_t *mutex);
- 释放互斥量的资源
int pthread_mutex_lock(pthread_mutex_t *mutex);
- 加锁，阻塞的，如果有一个线程加锁了，那么其他的线程只能阻塞等待
int pthread_mutex_trylock(pthread_mutex_t *mutex);
- 尝试加锁，如果加锁失败，不会阻塞，会直接返回。
int pthread_mutex_unlock(pthread_mutex_t *mutex);
- 解锁

11.死锁

有时，一个线程需要同时访问两个或更多不同的共享资源，而每个资源又都由不同的互斥量管理。当超过一个线程加锁同一组互斥量时，就有可能发生死锁。
两个或两个以上的进程在执行过程中，因争夺共享资源而造成的一种互相等待的现象，若无外力作用，它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁。
死锁的几种场景：
- 忘记释放锁
- 重复加锁
- 多线程多锁，抢占锁资源

12.读写锁

当有一个线程已经持有互斥锁时，互斥锁将所有试图进入临界区的线程都阻塞住。但是考虑一种情形，当前持有互斥锁的线程只是要读访问共享资源，而同时有其它几个线程也想读取这个共享资源，但是由于互斥锁的排它性，所有其它线程都无法获取锁，也就无法读访问共享资源了，但是实际上多个线程同时读访问共享资源并不会导致问题。
在对数据的读写操作中，更多的是读操作，写操作较少，例如对数据库数据的读写应用。为了满足当前能够允许多个读出，但只允许一个写入的需求，线程提供了读写锁来实现。
读写锁的特点：
- 如果有其它线程读数据，则允许其它线程执行读操作，但不允许写操作。
- 如果有其它线程写数据，则其它线程都不允许读、写操作。
- 写是独占的，写的优先级高。

13.读写锁相关操作函数

读写锁的类型 pthread_rwlock_t
int pthread_rwlock_init(pthread_rwlock_t *restrict rwlock, const pthread_rwlockattr_t *restrict attr);
int pthread_rwlock_destroy(pthread_rwlock_t *rwlock);
int pthread_rwlock_rdlock(pthread_rwlock_t *rwlock);
int pthread_rwlock_tryrdlock(pthread_rwlock_t *rwlock);
int pthread_rwlock_wrlock(pthread_rwlock_t *rwlock);
int pthread_rwlock_trywrlock(pthread_rwlock_t *rwlock);
int pthread_rwlock_unlock(pthread_rwlock_t *rwlock);

14.条件变量

条件变量的类型 pthread_cond_t
int pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);
int pthread_cond_destroy(pthread_cond_t *cond);
int pthread_cond_wait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex);
- 等待，调用了该函数，线程会阻塞。
- 当这个函数调用阻塞时，会对互斥锁进行解锁；当不阻塞时，继续向下执行，会重新加锁。
int pthread_cond_timedwait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex, const struct timespec *restrict abstime);
- 等待多长时间，调用了这个函数，线程会阻塞，直到指定的时间结束。
int pthread_cond_signal(pthread_cond_t *cond);
- 唤醒一个或者多个等待的线程
int pthread_cond_broadcast(pthread_cond_t *cond);
- 唤醒所有的等待的线程

15.信号量

信号量的类型 sem_t
int sem_init(sem_t *sem, int pshared, unsigned int value);
- 初始化信号量
- sem : 信号量变量的地址
- pshared : 0 用在线程间，非0 用在进程间
- value : 信号量中的值
int sem_destroy(sem_t *sem);
- 释放资源
int sem_wait(sem_t *sem);
- 对信号量加锁，调用一次对信号量的值-1，如果值为0，就阻塞
int sem_trywait(sem_t *sem);
int sem_timedwait(sem_t *sem, const struct timespec *abs_timeout);
int sem_post(sem_t *sem);
- 对信号量解锁，调用一次对信号量的值+1
int sem_getvalue(sem_t *sem, int *sval);
生产者消费者例子

sem_t psem;
sem_t csem;
init(psem, 0, 8);
init(csem, 0, 0);

producer() 
{
    sem_wait(&psem);
    sem_post(&csem)
}

customer() 
{
    sem_wait(&csem);
    sem_post(&psem)
}

这篇关于【Linux Server】三、Linux多线程开发的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

【Linux Server】三、Linux多线程开发

三、Linux多线程开发

相关编程文章