本文最后更新于：8 个月前

WebServer(4) EventLoop类

写在前面

源码链接：https://github.com/yxiao-yang/Tiny-Webserver.git

正文

1 EventLoop的作用

EventLoop 可以算是 muduo 的核心类了，EventLoop 对应着事件循环，其驱动着 Reactor 模型。我们之前的 Channel 和 Poller 类都需要依靠 EventLoop 类来调用。

Channel 负责封装文件描述符和其感兴趣的事件，里面还保存了事件发生时的回调函数
Poller 负责I/O复用的抽象，其内部调用epoll_wait获取活跃的 Channel
EventLoop 相当于 Channel 和 Poller 之间的桥梁，Channel 和 Poller 之间并不之间沟通，而是借助着 EventLoop 这个类。

这里上代码，我们可以看见 EventLoop 的成员变量就有 Channel 和 Poller。

std::unique_ptr<Poller> poller_;

ChannelList activeChannels_;            // 活跃的Channel
Channel* currentActiveChannel_;         // 当前处理的活跃channel

其实 EventLoop 也就是 Reactor模型的一个实例，其重点在于循环调用 epoll_wait 不断的监听发生的事件，然后调用处理这些对应事件的函数。而这里就设计了线程之间的通信机制了。

最初写socket编程的时候会涉及这一块，调用epoll_wait不断获取发生事件的文件描述符，这其实就是一个事件循环。

while (1) {
  // 返回发生的事件个数
  int n = epoll_wait(epfd, ep_events, EPOLL_SIZE, -1); 

  // 这个循环的所有文件描述符都是发生了事件的，效率得到了提高
  for (i = 0; i < n; i++) {
    if (ep_events[i].data.fd == serv_sock) { //客户端请求连接时
      // 接收新连接的到来
    } else {  //是客户端套接字时
      // 负责读写数据
    }
  }
}

图为EventLoop内部逻辑

2 EventLoop重要成员变量

using ChannelList = std::vector<Channel*>;

std::atomic_bool looping_;  // 原子操作，通过CAS实现，标志正在执行事件循环
std::atomic_bool quit_;     // 标志退出事件循环
std::atomic_bool callingPendingFunctors_; // 标志当前loop是否有需要执行的回调操作
const pid_t threadId_;      // 记录当前loop所在线程的id
Timestamp pollReturnTime_;  // poller返回发生事件的channels的返回时间
std::unique_ptr<Poller> poller_;

/**
 * TODO:eventfd用于线程通知机制，libevent和我的webserver是使用sockepair
 * 作用：当mainLoop获取一个新用户的Channel 需通过轮询算法选择一个subLoop 
 * 通过该成员唤醒subLoop处理Channel
 */
int wakeupFd_;  // mainLoop向subLoop::wakeupFd写数据唤醒
std::unique_ptr<Channel> wakeupChannel_;

ChannelList activeChannels_;            // 活跃的Channel，poll函数会填满这个容器
Channel* currentActiveChannel_;         // 当前处理的活跃channel
std::mutex mutex_;                      // 用于保护pendingFunctors_线程安全操作
std::vector<Functor> pendingFunctors_;  // 存储loop跨线程需要执行的所有回调操作

wakeupFd_：如果需要唤醒某个EventLoop执行异步操作，就向其wakeupFd_写入数据。
activeChannels_：调用poller_->poll时会得到发生了事件的Channel，会将其储存到activeChannels_中。
pendingFunctors_：如果涉及跨线程调用函数时，会将函数储存到pendingFunctors_这个任务队列中。

3 EventLoop重要方法

3.1 判断是否跨线程调用 IsInLoopThread()

图为Reactor结构图

muduo 是主从Reactor模型，主Reactor负责监听连接，然后通过轮询方法将新连接分派到某个从Reactor上进行维护。

每个线程中只有一个Reactor
每个Reactor中都只有一个EventLoop
每个EventLoop被创建时都会保存创建它的线程值。

1	`bool IsInLoopThread() const { return threadId_ == CurrentThread::tid(); }`

// 以下是 CurrentThread::Tid 的实现
namespace CurrentThread {
  extern __thread int t_cachedTid; // 保存tid缓冲，避免多次系统调用

  void CacheTid();

  // 内联函数
  inline int Tid() {
    if (__builtin_expect(t_cachedTid == 0, 0)) {
      CacheTid();
    }
    return t_cachedTid;
   }
} // namespace CurrentThread

3.2 EventLoop 创建之初都做了什么？

EventLoop::EventLoop()
    : looping_(false), // 还未开启任务循环，设置为false
      quit_(false), // 还未停止事件循环
      callingPendingFunctors_(false),
      threadId_(CurrentThread::Tid()), // 获取当前线程tid
      poller_(Poller::NewDefaultPoller(this)), // 获取默认的poller
      timerQueue_(new TimerQueue(this)), // 定时器管理对象
      wakeupFd_(createEventfd()), // 创建eventfd作为线程间等待/通知机制
      wakeupChannel_(new Channel(this, wakeupFd_)), // 封装wakeupFd成Channel
      currentActiveChannel_(nullptr) {
  LOG_DEBUG << "EventLoop created " << this << " the index is " << threadId_;
  LOG_DEBUG << "EventLoop created wakeupFd " << wakeupChannel_->fd();
          
  // 已经保存了thread值，之前已经创建过了EventLoop
  // 一个线程只能对应一个EventLoop，直接退出
  if (t_loopInThisThread) {
    LOG_FATAL << "Another EventLoop" << t_loopInThisThread << " exists in this thread " << threadId_;
  } else {
    // 线程静态变量保存tid值
    t_loopInThisThread = this;
  }  

  // 设置wakeupfd的事件类型以及发生事件的回调函数
  wakeupChannel_->SetReadCallback(std::bind(&EventLoop::HandleRead, this));
  // 每一个EventLoop都将监听wakeupChannel的EPOLLIN事件
  wakeupChannel_->EnableReading();
}

这里关注一下eventfd的创建，创建时指定其为非阻塞

int CreateEventfd() {
  int evfd = ::eventfd(0, EFD_NONBLOCK | EFD_CLOEXEC);
  if (evfd < 0) {
    LOG_FATAL("eventfd error:%d \n", errno);
  }
  return evfd;
}

3.3 EventLoop 销毁时的操作

EventLoop::~EventLoop() {
  // channel移除所有感兴趣事件
  wakeupChannel_->DisableAll();
  // 将channel从EventLoop中删除
  wakeupChannel_->Remove();
  // 关闭 wakeupFd_
  ::close(wakeupFd_);
  // 指向EventLoop指针为空
  t_loopInThisThread = nullptr;
}

移除wakeupChannel要监视的所有事件
将wakeupChannel从Poller上移除
关闭wakeupFd
将EventLoop指针置为空

3.4 EventLoop 事件驱动的核心——Loop()

调用 EventLoop::loop() 正式开启事件循环，其内部会调用 Poller::poll -> ::epoll_wait正式等待活跃的事件发生，然后处理这些事件。

调用 poller_->Poll(kPollTimeMs, &activeChannels_) 将活跃的 Channel 填充到 activeChannels 容器中。
遍历 activeChannels 调用各个事件的回调函数
调用 DoPengdingFunctiors()处理跨线程调用的回调函数

void EventLoop::Loop() {
  looping_ = true;
  quit_ = false;
    
  LOG_INFO << "EventLoop " << this << " start looping";
    
  while (!quit_) {
    // 清空activeChannels_
	activeChannels_.clear();
	// 获取
	pollReturnTime_ = poller_->Poll(kPollTimeMs, &activeChannels_);
	for (Channel *channel : activeChannels_) {
	  channel->HandleEvent(pollReturnTime_);
    }
    // 执行当前EventLoop事件循环需要处理的回调操作
    /**
    * IO thread：mainLoop accept fd 打包成 channel 分发给 subLoop
    * mainLoop实现注册一个回调，交给subLoop来执行，wakeup subLoop 之后，让其执行注册的回调操作
    * 这些回调函数在 std::vector<Functor> pendingFunctors_; 之中
    */
    DoPendingFunctors();
  }
  looping_ = false;    
}

3.5 EventLoop 如何执行分派任务

EventLoop 使用 runInLoop(Functor cb)函数执行任务，传入参数是一个回调函数，让此 EventLoop 去执行任务，可跨线程调用。比如可以这么调用：

1	`ioLoop->RunInLoop(std::bind(&TcpConnection::connectEstablished, conn));`

这是 TcpServer类的一处代码，其在接收了一个新连接后会创建一个对应的TcpConnection对象来负责连接。而TcpConnection是需要执行一些初始化操作的，这里就是让EventLoop执行TcpConnection的初始化任务。

我们继续看一下 EventLoop::RunInLoop 的内部

// 在I/O线程中调用某个函数，该函数可以跨线程调用
void EventLoop::RunInLoop(Functor cb) {
  if (IsInLoopThread()) {
    // 如果是在当前I/O线程中调用，就同步调用cb回调函数
    cb();
  } else {
    // 否则在其他线程中调用，就异步将cb添加到任务队列当中，
    // 以便让EventLoop真实对应的I/O线程执行这个回调函数
    QueueInLoop(std::move(cb));
  }
}

IsInLoopThread判断本线程是不是创建该 EventLoop 的线程

如果是创建该 EventLoop 的线程，则直接同步调用，执行任务
如果不是，则说明这是跨线程调用。需要执行QueueInLoop

3.6 EventLoop 是如何保证线程安全的

还以上述的那个例子：

1 2	`EventLoop* ioLoop = threadPool_->getNextLoop(); ioLoop->R unInLoop(std::bind(&TcpConnection::connectEstablished, conn));`

这里获取的 ioLoop 是从线程池中某个线程创建而来的，那么可以知道创建 ioLoop 的线程和目前运行的线程不是同一个线程，那么这个操作是线程不安全的。

一般为了保证线程安全，我们可能会使用互斥锁之类的手段来保证线程同步。但是，互斥锁的粗粒度难以把握，如果锁的范围很大，各个线程频繁争抢锁执行任务会大大拖慢网络效率。

而 muduo 的处理方法是，保证各个任务在其原有的线程中执行。如果跨线程执行，则将此任务加入到任务队列中，并唤醒应当执行此任务的线程。而原线程唤醒其他线程之后，就可以继续执行别的操作了。可以看到，这是一个异步的操作。
接下来继续探索QueueInLoop的实现：

void EventLoop::QueueInLoop(Functor cb) {
  {
    std::unique_lock<std::mutex> lock(mutex_);
	pendingFunctors_.emplace_back(cb); // 使用了std::move
  }

  // 唤醒相应的，需要执行上面回调操作的loop线程
  /** 
   * TODO:
   * std::atomic_bool callingPendingFunctors_; 标志当前loop是否有需要执行的回调操作
   * 这个 || callingPendingFunctors_ 比较有必要，因为在执行回调的过程可能会加入新的回调
   * 则这个时候也需要唤醒，否则就会发生有事件到来但是仍被阻塞住的情况
   */
  if (!IsInLoopThread() || callingPendingFunctors_) {
	// 唤醒loop所在的线程
	Wakeup();
  }
}

QueueInLoop的实现也有很多细节，首先可以看到在局部区域生成一个互斥锁（支持RALL），然后再进行任务队列加入新任务的操作。
这是因为可能此EventLoop会被多个线程所操纵，假设多个线程调用loop->QueueInLoop(cb)，都向此任务队列加入自己的回调函数，这势必会有线程间的竞争情况。需要在此处用一个互斥锁保证互斥，可以看到这个锁的粒度比较小。

再往下，注意下方这个判断，if (!IsInLoopThread() || callingPendingFunctors_)，第一个很好理解，不在本线程则唤醒这个 EventLoop所在的线程。第二个标志位的判断是什么意思呢？

callingPendingFunctors_ 这个标志位在 EventLoop::DoPendingFunctors() 函数中被标记为 true。 也就是说如果 EventLoop 正在处理当前的 PendingFunctors 函数时有新的回调函数加入，我们也要继续唤醒。 倘若不唤醒，那么新加入的函数就不会得到处理，会因为下一轮的 epoll_wait 而继续阻塞住，这显然会降低效率。这也是一个 muduo 的细节。
继续探索 Wakeup() 函数，从其名字就很容易看出来，这是唤醒其他线程的操作。如何唤醒那个EventLoop的所在线程呢，其实只要往其 wakeupFd_写数据就行。

每个EventLoop的wakeupFd_都被加入到epoll对象中，只要写了数据就会触发读事件，epoll_wait就会返回。因此EventLoop::loop中阻塞的情况被打断，Reactor又被事件「驱动」了起来。

void EventLoop::Wakeup() {
  // 可以看到写的数据很少，纯粹是为了通知有事件产生
  uint64_t one = 1;
  ssize_t n = sockets::write(wakeupFd_, &one, sizeof one);
  if (n != sizeof one) {
    LOG_ERROR << "EventLoop::wakeup() writes " << n << " bytes instead of 8";
  }
}

这里可以看另一个例子，TcpServer的销毁连接操作。会在baseLoop中获取需要销毁的连接所在的ioLoop，然后让ioLoop执行销毁操作，细节可以看注释。

void TcpServer::RemoveConnectionInLoop(const TcpConnectionPtr &conn) {
  LOG_INFO << "TcpServer::removeConnectionInLoop [" << name_.c_str() << "] - connection " << conn->name().c_str();
  // 从map删除
  connections_.erase(conn->Name());
  // 获取subLoop
  EventLoop *ioLoop = conn->GetLoop();
  /**
   * subLoop调用TcpConnection::ConnectDestroyed
   * 因为是在baseLoop的线程里调用subLoop的函数，所以不能同步调用，需要放入队列
   * 在加锁的环境下将此回调函数保存到subLoop的pendingFunctors_中并唤醒
   * 那么这个唤醒就是在baseLoop的线程里调用subLoop::Wakeup写数据给subLoop的wakeFd,subLoop的主事件循环被唤醒执行pendingFunctors_
   * 而baseLoop线程在wakeup写完数据之后就没有继续往下执行了，这就保证整个函数只被subloop线程执行
   * 保证了线程的安全
   */
  ioLoop->QueueInLoop(
    std::bind(&TcpConnection::ConnectDestroyed, conn));
}

3.7 EventLoop 是如何处理 pendingFunctors 里储存的函数的？

这里又是一处细节。我们为什么不直接遍历这个容器，而是又不嫌麻烦地定义了一个 functors 交换我们 pendingFunctors 的元素，然后遍历 functors？

我们如果直接遍历 pendingFunctors，然后在这个过程中别的线程又向这个容器添加新的要被调用的函数，那么这个过程是线程不安全的。如果使用互斥锁，那么在执行回调任务的过程中，都无法添加新的回调函数。这是十分影响效率的。

所以我们选择拷贝这个时候的回调函数，这样只需要用互斥锁保护一个交换的操作。锁的粗粒度小了很多。我们执行回调操作就直接遍历这个functors容器，而其他线程继续添加回调任务到 pendingFunctors。

void EventLoop::DoPendingFunctors() {
  std::vector<Functor> functors;
  callingPendingFunctors_ = true;

  /**
   * 如果没有生成这个局部的 functors
   * 则需要一个粗粒度较大的互斥锁加，我们直接遍历pendingFunctors
   * 那么其他线程这个时候无法访问，无法向里面注册回调函数，增加服务器时延
   */
  {
    std::unique_lock<std::mutex> lock(mutex_);
    functors.swap(pendingFunctors_);
  }

  for (const Functor &functor : functors) {
    functor();
  }
  // 记录此时结束了处理回调函数
  callingPendingFunctors_ = false;
}

3.8 主动关闭事件循环时会发生什么？

void EventLoop::Quit() {
  quit_ = true;

  /**
   * TODO:生产者消费者队列派发方式和muduo的派发方式
   * 有可能是别的线程调用quit(调用线程不是生成EventLoop对象的那个线程)
   * 比如在工作线程(subLoop)中调用了IO线程(mainLoop)
   * 这种情况会唤醒主线程
   */
  if (IsInLoopThread()) {
    Wakeup();
  }
}

quit_置为 true
判断是否是当前线程调用，若不是则唤醒 EventLoop去处理事件。

第二点可以深究一下，通过 while(!quit_) 可以判断，唤醒之后会继续处理一轮事件，然后再进入判断语句，然后因为 quit_ = true 而退出循环。

所以如果可以调用成功，说明之前的任务都处理完了，不会出现正在处理任务的时候突然退出了。但是不能保证未来事件发生的处理。

项目实战从零开始打造WebServer

本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！

WebServer(5) Buffer类上一篇

WebServer(3) Poller类下一篇