天下

记录修行的印记

epoll使用

epoll使用

在linux的网络编程中,很长的时间都在使用select来做事件触发。在linux新的内核中,有了一种替换它的机制,就是epoll。
相比于select,epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中,它是采用轮询来处理的,轮询的fd数目越多,自然耗时越多。并且,在linux
/posix_types.h头文件有这样的声明:
#define __FD_SETSIZE    1024
表示select最多同时监听1024个fd,当然,可以通过修改头文件再重编译内核来扩大这个数目,但这似乎并不治本。

epoll的接口非常简单,一共就三个函数:
1int epoll_create(int size);
创建一个epoll的句柄,size用来告诉内核这个监听的数目一共有多大。这个参数不同于select()中的第一个参数,给出最大监听的fd
+1的值。需要注意的是,当创建好epoll句柄后,它就是会占用一个fd值,在linux下如果查看/proc/进程id/fd/,是能够看到这个fd的,所以在使用完epoll后,必须调用close()关闭。


2int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件注册函数,它不同与select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。第一个参数是epoll_create()的返回值,第二个参数表示动作,用三个宏来表示:
EPOLL_CTL_ADD:注册新的fd到epfd中;
EPOLL_CTL_MOD:修改已经注册的fd的监听事件;
EPOLL_CTL_DEL:从epfd中删除一个fd;
第三个参数是需要监听的fd,第四个参数是告诉内核需要监听什么事,
struct epoll_event结构如下:

typedef union epoll_data {
    
void *ptr;
    
int fd;
    __uint32_t u32;
    __uint64_t u64;
} epoll_data_t;

struct epoll_event {
    __uint32_t events; 
/* Epoll events */
    epoll_data_t data; 
/* User data variable */
};

events可以是以下几个宏的集合:
EPOLLIN :表示对应的文件描述符可以读(包括对端SOCKET正常关闭);
EPOLLOUT:表示对应的文件描述符可以写;
EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);
EPOLLERR:表示对应的文件描述符发生错误;
EPOLLHUP:表示对应的文件描述符被挂断;
EPOLLET: 将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的。
EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里


3int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
等待事件的产生,类似于select()调用。参数events用来从内核得到事件的集合,maxevents告之内核这个events有多大,这个 maxevents的值不能大于创建epoll_create()时的size,参数timeout是超时时间(毫秒,0会立即返回,
-1阻塞)。该函数返回需要处理的事件数目,如返回0表示已超时。


4、关于ET、LT两种工作模式:
可以得出这样的结论:
ET模式仅当状态发生变化的时候才获得通知,这里所谓的状态的变化并不包括缓冲区中还有未处理的数据,也就是说,如果要采用ET模式,需要一直read
/write直到出错为止,很多人反映为什么采用ET模式只接收了一部分数据就再也得不到通知了,大多因为这样;而LT模式是只要有数据没有处理就会一直通知下去的.


那么究竟如何来使用epoll呢?其实非常简单。
通过在包含一个头文件#include 
<sys/epoll.h> 以及几个简单的API将可以大大的提高你的网络服务器的支持人数。

首先通过create_epoll(
int maxfds)来创建一个epoll的句柄,其中maxfds为你epoll所支持的最大句柄数。这个函数会返回一个新的epoll句柄,之后的所有操作将通过这个句柄来进行操作。在用完之后,记得用close()来关闭这个创建出来的epoll句柄。

之后在你的网络主循环里面,每一帧的调用epoll_wait(
int epfd, epoll_event events, int max events, int timeout)来查询所有的网络接口,看哪一个可以读,哪一个可以写了。基本的语法为:
nfds 
= epoll_wait(kdpfd, events, maxevents, -1);
其中kdpfd为用epoll_create创建之后的句柄,events是一个epoll_event
*的指针,当epoll_wait这个函数操作成功之后,epoll_events里面将储存所有的读写事件。max_events是当前需要监听的所有socket句柄数。最后一个timeout是 epoll_wait的超时,为0的时候表示马上返回,为-1的时候表示一直等下去,直到有事件范围,为任意正整数的时候表示等这么长的时间,如果一直没有事件,则范围。一般如果网络主循环是单独的线程的话,可以用-1来等,这样可以保证一些效率,如果是和主逻辑在同一个线程的话,则可以用0来保证主循环的效率。

epoll_wait范围之后应该是一个循环,遍利所有的事件。

几乎所有的epoll程序都使用下面的框架:

    
for( ; ; )
    {
        nfds 
= epoll_wait(epfd,events,20,500);
        
for(i=0;i<nfds;++i)
        {
            
if(events[i].data.fd==listenfd) //有新的连接
            {
                connfd 
= accept(listenfd,(sockaddr *)&clientaddr, &clilen); //accept这个连接
                ev.data.fd=connfd;
                ev.events
=EPOLLIN|EPOLLET;
                epoll_ctl(epfd,EPOLL_CTL_ADD,connfd,
&ev); //将新的fd添加到epoll的监听队列中
            }
            
else if( events[i].events&EPOLLIN ) //接收到数据,读socket
            {
                n 
= read(sockfd, line, MAXLINE)) < 0    //
                ev.data.ptr = md;     //md为自定义类型,添加数据
                ev.events=EPOLLOUT|EPOLLET;
                epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,
&ev);//修改标识符,等待下一个循环时发送数据,异步处理的精髓
            }
            
else if(events[i].events&EPOLLOUT) //有数据待发送,写socket
            {
                
struct myepoll_data* md = (myepoll_data*)events[i].data.ptr;    //取数据
                sockfd = md->fd;
                send( sockfd, md
->ptr, strlen((char*)md->ptr), 0 );        //发送数据
                ev.data.fd=sockfd;
                ev.events
=EPOLLIN|EPOLLET;
                epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,
&ev); //修改标识符,等待下一个循环时接收数据
            }
            
else
            {
                
//其他的处理
            }
        }
    }



epoll 
- I/event notification facility

/* Copyright (C) 2002-2006, 2007 Free Software Foundation, Inc.
   This file is part of the GNU C Library.

   The GNU C Library is free software; you can redistribute it and/or
   modify it under the terms of the GNU Lesser General Public
   License as published by the Free Software Foundation; either
   version 2.1 of the License, or (at your option) any later version.

   The GNU C Library is distributed in the hope that it will be useful,
   but WITHOUT ANY WARRANTY; without even the implied warranty of
   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
   Lesser General Public License for more details.

   You should have received a copy of the GNU Lesser General Public
   License along with the GNU C Library; if not, write to the Free
   Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA
   02111-1307 USA.  
*/

#ifndef    _SYS_EPOLL_H
#define    _SYS_EPOLL_H    1

#include 
<stdint.h>
#include 
<sys/types.h>

/* Get __sigset_t.  */
#include 
<bits/sigset.h>

#ifndef __sigset_t_defined
# define __sigset_t_defined
typedef __sigset_t sigset_t;
#endif


enum EPOLL_EVENTS
  {
    EPOLLIN 
= 0x001,
#define EPOLLIN EPOLLIN
    EPOLLPRI 
= 0x002,
#define EPOLLPRI EPOLLPRI
    EPOLLOUT 
= 0x004,
#define EPOLLOUT EPOLLOUT
    EPOLLRDNORM 
= 0x040,
#define EPOLLRDNORM EPOLLRDNORM
    EPOLLRDBAND 
= 0x080,
#define EPOLLRDBAND EPOLLRDBAND
    EPOLLWRNORM 
= 0x100,
#define EPOLLWRNORM EPOLLWRNORM
    EPOLLWRBAND 
= 0x200,
#define EPOLLWRBAND EPOLLWRBAND
    EPOLLMSG 
= 0x400,
#define EPOLLMSG EPOLLMSG
    EPOLLERR 
= 0x008,
#define EPOLLERR EPOLLERR
    EPOLLHUP 
= 0x010,
#define EPOLLHUP EPOLLHUP
    EPOLLRDHUP 
= 0x2000,
#define EPOLLRDHUP EPOLLRDHUP
    EPOLLONESHOT 
= (1 << 30),
#define EPOLLONESHOT EPOLLONESHOT
    EPOLLET 
= (1 << 31)
#define EPOLLET EPOLLET
  };


/* Valid opcodes ( "op" parameter ) to issue to epoll_ctl().  */
#define EPOLL_CTL_ADD 1    /* Add a file decriptor to the interface.  */
#define EPOLL_CTL_DEL 2    /* Remove a file decriptor from the interface.  */
#define EPOLL_CTL_MOD 3    /* Change file decriptor epoll_event structure.  */


typedef union epoll_data
{
  
void *ptr;
  
int fd;
  uint32_t u32;
  uint64_t u64;
} epoll_data_t;

struct epoll_event
{
  uint32_t events;    
/* Epoll events */
  epoll_data_t data;    
/* User data variable */
};


__BEGIN_DECLS

/* Creates an epoll instance.  Returns an fd for the new instance.
   The "size" parameter is a hint specifying the number of file
   descriptors to be associated with the new instance.  The fd
   returned by epoll_create() should be closed with close().  
*/
extern int epoll_create (int __size) __THROW;


/* Manipulate an epoll instance "epfd". Returns 0 in case of success,
   -1 in case of error ( the "errno" variable will contain the
   specific error code ) The "op" parameter is one of the EPOLL_CTL_*
   constants defined above. The "fd" parameter is the target of the
   operation. The "event" parameter describes which events the caller
   is interested in and any associated user data.  
*/
extern int epoll_ctl (int __epfd, int __op, int __fd,
              
struct epoll_event *__event) __THROW;


/* Wait for events on an epoll instance "epfd". Returns the number of
   triggered events returned in "events" buffer. Or -1 in case of
   error with the "errno" variable set to the specific error code. The
   "events" parameter is a buffer that will contain triggered
   events. The "maxevents" is the maximum number of events to be
   returned ( usually size of "events" ). The "timeout" parameter
   specifies the maximum wait time in milliseconds (-1 == infinite).

   This function is a cancellation point and therefore not marked with
   __THROW.  
*/
extern int epoll_wait (int __epfd, struct epoll_event *__events,
               
int __maxevents, int __timeout);


/* Same as epoll_wait, but the thread's signal mask is temporarily
   and atomically replaced with the one provided as parameter.

   This function is a cancellation point and therefore not marked with
   __THROW.  
*/
extern int epoll_pwait (int __epfd, struct epoll_event *__events,
            
int __maxevents, int __timeout,
            __const __sigset_t 
*__ss);

__END_DECLS

#endif /* sys/epoll.h */




// epoll.cpp : Defines the entry point for the console application.
//

#include 
"stdafx.h"


#define MAX_EVENTS 10     
#define PORT 8080     
//设置socket连接为非阻塞模式     
void setnonblocking(int sockfd) {    
    
int opts;    

    opts 
= fcntl(sockfd, F_GETFL);    
    
if(opts < 0) {    
        perror(
"fcntl(F_GETFL)\n");    
        exit(
1);    
    }    
    opts 
= (opts | O_NONBLOCK);    
    
if(fcntl(sockfd, F_SETFL, opts) < 0) {    
        perror(
"fcntl(F_SETFL)\n");    
        exit(
1);    
    }    
}    

int main()
{    
    
struct epoll_event ev, events[MAX_EVENTS];    
    
int addrlen, listenfd, conn_sock, nfds, epfd, fd, i, nread, n;    
    
struct sockaddr_in local, remote;    
    
char buf[BUFSIZ];    

    
//创建listen socket     
    if( (listenfd = socket(AF_INET, SOCK_STREAM, 0)) < 0) {    
        perror(
"sockfd\n");    
        exit(
1);    
    }    
    setnonblocking(listenfd);    
    bzero(
&local, sizeof(local));    
    local.sin_family 
= AF_INET;    
    local.sin_addr.s_addr 
= htonl(INADDR_ANY);;    
    local.sin_port 
= htons(PORT);    
    
if( bind(listenfd, (struct sockaddr *&local, sizeof(local)) < 0) {    
        perror(
"bind\n");    
        exit(
1);    
    }    
    listen(listenfd, 
20);    
    epfd 
= epoll_create(MAX_EVENTS);
    pr_debug(
"listenfd:%d,epfd:%d",listenfd,epfd);
    
if (epfd == -1) {    
        perror(
"epoll_create");    
        exit(EXIT_FAILURE);    
    }      
    ev.events 
= EPOLLIN;    
    ev.data.fd 
= listenfd;    
    
if (epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev) == -1) {    
        perror(
"epoll_ctl: listen_sock");    
        exit(EXIT_FAILURE);    
    }    

    
for (;;) {
        
//nfds = epoll_wait(epfd, events, MAX_EVENTS, -1); 
        nfds = epoll_wait(epfd, events, MAX_EVENTS, 1000); 

        pr_debug(
"nfds:%d",nfds);
        
if (nfds == -1) {    
            perror(
"epoll_pwait");    
            exit(EXIT_FAILURE);    
        }    

        
for (i = 0; i < nfds; ++i) 
        {    
            fd 
= events[i].data.fd;    
            
if (fd == listenfd)
            {
                
while ((conn_sock = accept(listenfd,(struct sockaddr *&remote, (size_t *)&addrlen)) > 0)     
                {    
                    setnonblocking(conn_sock);    
                    ev.events 
= EPOLLIN | EPOLLET;    
                    ev.data.fd 
= conn_sock;    
                    
if (epoll_ctl(epfd, EPOLL_CTL_ADD, conn_sock, &ev) == -1)  
                    {    
                            perror(
"epoll_ctl: add");    
                            exit(EXIT_FAILURE);    
                    }    
                }    
                
if (conn_sock == -1) {    
                    
if (errno != EAGAIN && errno != ECONNABORTED     
                        
&& errno != EPROTO && errno != EINTR)     
                        perror(
"accept");    
                }    
                
continue;    
            }      
            
if (events[i].events & EPOLLIN)
            {    
                n 
= 0;    
                
while ((nread = read(fd, buf + n, BUFSIZ-1)) > 0) {    
                    n 
+= nread;    
                }    
                
if (nread == -1 && errno != EAGAIN) {    
                    perror(
"read error");    
                }    
                ev.data.fd 
= fd;    
                ev.events 
= events[i].events | EPOLLOUT;    
                
if (epoll_ctl(epfd, EPOLL_CTL_MOD, fd, &ev) == -1) {    
                    perror(
"epoll_ctl: mod");    
                }    
            }    
            
if (events[i].events & EPOLLOUT)
            {    
                sprintf(buf, 
"HTTP/1.1 200 OK\r\nContent-Length: %d\r\n\r\nHello World"11);    
                
int nwrite, data_size = strlen(buf);    
                n 
= data_size;    
                
while (n > 0) {    
                    nwrite 
= write(fd, buf + data_size - n, n);    
                    
if (nwrite < n) {    
                        
if (nwrite == -1 && errno != EAGAIN) {    
                            perror(
"write error");    
                        }    
                        
break;    
                    }    
                    n 
-= nwrite;    
                }    
                close(fd);    
            }    
        }    
    }    

    
return 0;    
}

posted on 2014-03-21 16:56 天下 阅读(643) 评论(0)  编辑 收藏 引用 所属分类: Linux编程


只有注册用户登录后才能发表评论。
【推荐】超50万行VC++源码: 大型组态工控、电力仿真CAD与GIS源码库
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理


<2014年3月>
2324252627281
2345678
9101112131415
16171819202122
23242526272829
303112345

导航

统计

常用链接

留言簿(4)

随笔分类(377)

随笔档案(327)

链接

最新随笔

搜索

最新评论