nodejs高并发大流量的设计实现,控制并发的三种方法

nodejs高并发大流量的设计实现,控制并发的三种方法
eventproxy、async.mapLimit、async.queue控制并发
Node.js是建立在Google V8 JavaScript引擎之上的网络服务器框架，允许开发者能够用客户端使用的语言JavaScript在服务器端编码。
----------------
node.js优缺点：
优点：高并发，io密集型处理，可以作为单页面应用，便于爬虫抓取。
缺点：不适合cpu计算密集型，对关系数据库支持不好

nodejs高并发大流量的设计实现

原理：非阻塞事件驱动实现异步开发,通过事件驱动的I/O来操作完成跨平台数据密集型实时应用
传统的server 每个请求生成一个线程， nodejs是一个单线程的，使用libuv保持数万并发

libuv原理：
c语言编写的基础库实现主循环，文件，网络即可

libuv的改进：
回传上下文信息，其它线程不能访问缺省主循环，loop不支持多线程

代码可读性维护改进：
async：
async.waterfall([getcatalog, getaticle,getTigle])

promise 的方法
koa写法
es6写法使用yield

var titles = []
co(function *() {
var catalog = yield getCatalog(gid)
var articles = yield getArticles(catalog)
titles = yield getTitles(articles)
});

前端优化问题：移除iscorll，合并请求，tcp优化，http优化，localstorate，html5离线缓存
api优化：restfulapi，标准输入输出
ui优化：使用同一的框架，前端组件化
异常处理： log监控，避免大文件处理，retry处理

===================

用eventproxy、async.mapLimit、async.queue控制并发

1.用eventproxy实现控制并发

var EventProxy = require('eventproxy');

const most = 5;//并发数5

var urllist = [....];//待抓取url列表，100个

function foo(start){

    var ep = new EventProxy();

    ep.after('ok',most,function(){

        foo(start+most);//一个批次任务完成，递归进行下一批任务

    });

    var q=0;

    for(var i=start;i<urllist.length;i++){

        if(q>=most){

            break;//最多添加most个任务

        }

        http.get(urllist[i],function(res){

            //....

            res.on('end',function(){

                ep.emit('ok');//一个任务完成，触发一次ok事件

            });

        });

        q++;

    }

}

foo(0);

2.使用 async.mapLimit 控制并发

var async = require('async');

//模拟一组连接地址

var urls = [];

for(var i = 0; i < 30; i++) {

    urls.push('http://datasource_' + i);

}

console.log(urls);

// 并发连接数的计数器

var concurrencyCount = 0;

// 并发抓取数据的过程

var fetchUrl = function (url, callback) {

    // delay 的值在 2000 以内，是个随机的整数

    var delay = parseInt((Math.random() * 10000000) % 2000, 10);

    concurrencyCount++;

    console.log('现在的并发数是', concurrencyCount, '，正在抓取的是', url, '，耗时' + delay + '毫秒');

    setTimeout(function () {

        concurrencyCount--;

        //抓取成功，调用回调函数

        callback(null, url + ' html content');

    }, delay);

};

//使用 async.mapLimit 来 5 个并发抓取，并获取结果

async.mapLimit(urls, 5, function (url, callback) {

    fetchUrl(url, callback);

}, function (err, result) {

    //所有连接抓取成功，返回回调结果列表

    console.log('final:');

    console.log(result);

});

3.使用async.queue 控制并发

"use strict"

var http = require('http');

var cheerio = require('cheerio');

var URL = require('url');

var path = require('path');

var fs = require('fs');

var async = require('async');

var baseUrl = "http://cnodejs.org/";

var targetUrl = "http://cnodejs.org/";

var stime = new Date();

function sGet(url,callback){

  var chunks = [];

  http.get(url,(res)=>{

    if (res.statusCode != '200') {

      callback({message:"抓取失败,状态码:"+res.statusCode,url:url});

      return;

    }

    res.on('data',(chunk)=>{

      chunks.push(chunk);

    });

    res.on('end',()=>{

      callback(null,Buffer.concat(chunks).toString());

    });

  }).on('error',(e)=>{

    callback({message:"抓取失败",url:url,err:e});

  });

}

sGet(targetUrl,(err,data)=>{

  if (err) {

    console.log(err);

    return false;

  }

  var $ = cheerio.load(data);

  var anchors = $("#topic_list a.topic_title");

  console.log('共'+anchors.length+'个任务');

  const most=5;//并发数

    //创建队列并指定并发数

  var q=async.queue(function(url,callback){

    var filename = path.basename(url)+'.txt';

    sGet(url, (err, data)=> {

      if (err) {

        callback(err);

        return false;

      }

      fs.writeFile('./html/' + filename, data, function (err) {

        if (err) {

          throw err;

        }

        callback(null,filename);

      });

    });

  },most);

  q.drain = function() {

    console.log('任务全部完成,共耗时:'+(new Date()-stime)+'ms');

  }

  anchors.each(function(){

    var url = URL.resolve(baseUrl,$(this).attr('href'));

    q.push(url,function(err,filename){

      if (err) {

        console.log(err);

        return;

      }

      console.log("finished:"+filename);

    });

  });

});

nodejs高并发大流量的设计实现,控制并发的三种方法的更多相关文章

高并发大流量专题---11、Web服务器的负载均衡
高并发大流量专题---11.Web服务器的负载均衡一.总结一句话总结: 推荐使用nginx七层(应用层)负载均衡的实现:配置那是相当的简单 http{ upstream cluster{ serv ...
高并发大流量专题---10、MySQL数据库层的优化
高并发大流量专题---10.MySQL数据库层的优化一.总结一句话总结: mysql先考虑做分布式缓存,过了缓存后就做mysql数据库层面的优化 1.mysql数据库层的优化的前面一层是什么? 数 ...
高并发大流量专题---5、CDN加速
高并发大流量专题---5.CDN加速一.总结一句话总结: CDN就是多整几台节点服务器,选距离用户最近的服务器来给用户服务,实现的话可以用阿里云.腾讯云他们提供的功能,简单方便,妈妈再也不用担心我 ...
高并发大流量专题---3、前端优化（减少HTTP请求次数）
高并发大流量专题---3.前端优化(减少HTTP请求次数) 一.总结一句话总结: 图片地图:使用<map><area></area></map>标签. ...
[原创]lvs+ospf+nginx实现高可用大流量web架构
lvs+ospf+nginx实现高可用大流量web架构配置总概述架构图: 配置如下: .quagga之zebra配置: # cat /etc/quagga/zebra.conf ! ! Zebra ...
java 分次读取大文件的三种方法
1. java 读取大文件的困难 java 读取文件的一般操作是将文件数据全部读取到内存中,然后再对数据进行操作.例如 Path path = Paths.get("file path&qu ...
Java并发编程（二）创建线程的三种方法
进程与线程 1. 进程进程和代码之间的关系就像音乐和乐谱之间的关系一样,演奏结束的时候音乐就不存在了但乐谱还在:程序执行结束的时候进程就消失了但代码还在,而计算机就是代码的演奏家. 2. 线程线 ...
php解决与处理网站高并发大流量访问的方法
方法/步骤首先,确认服务器硬件是否足够支持当前的流量普通的P4服务器一般最多能支持每天10万独立IP,如果访问量比这个还要大, 那么必须首先配置一台更高性能的专用服务器才能解决问题 ,否则怎么 ...
高并发下用pdo,文件排它锁,redis三种方法对比
<?php header('content-type:text/html;charset=utf-8'); // //无控制 // $DB_DSN = ' ...

随机推荐

iOS 裁剪View指定的角裁剪
在开发中碰到view的左上角和右上角需要裁剪,具体实现方法如下: UIBezierPath *maskPath = [UIBezierPath bezierPathWithRoundedRect:se ...
google的python语言规范
Python语言规范 Lint Tip 对你的代码运行pylint 定义: pylint是一个在Python源代码中查找bug的工具. 对于C和C++这样的不那么动态的(译者注: 原文是less ...
VS 错误：未找到与约束contractname Microsoft.VisualStudio.Utilities.IContentTypeRegistryService
今天突然停电,vs重启的时候就出现了问题,最开始是提示如图1所示的错误,开始觉得可能这提示不重要,也就关闭不在提醒了,结果,vs启动是启动了,项目也开启了,但是生成的时候,依旧就报了图1的错图1 去 ...
Reading List on Automated Program Repair
Some resources: https://www.monperrus.net/martin/automatic-software-repair 2017 [ ] DeepFix: Fixing ...
HTML禁止右键复制【两行代码实现】
很多的站长朋友会考虑保护网站的内容不被人复制,或者是不被人轻易的复制,下面就来告诉如何用两行代码来做HTML禁止右键复制html的方法: document.oncontextmenu=new Func ...
java项目（学习和研究）
java项目就是研究,不断的对项目进行迭代,把产品做的越来越好,就是research. 自己想着做一个java项目把,可以类似牛客网,想好自己的预期产品,在设计的过程中可以不断改进和扩展,在做这个项目 ...
PHP版本MS17-010检测小脚本
内网渗透的时候有点用处,可以检测MS17-010的漏洞并获取操作系统信息,配合BURP可批量检测,纯socket发包,无需其他扩展. <?php //根据巡风python代码翻译成PHP代码 / ...
postgresql 9源码安装
安装过程: 1.configuration --prefix=PREFIX install all files under the directory PREFIX instead of usr/lo ...
Eclipse 00：安装教程 + 汉化 + 简单创建java项目
Java 安装教程(Eclipse) 目录: 要安装Java 要分两个步骤: 1.JDK的安装 2.Eclipse的安装 3.Eclipse汉化 4.Eclipse创建简单java项目 1和2的顺序不 ...
Ｃ++11 vector使用emplace_back代替push_back
C++11中,针对顺序容器(如vector.deque.list),新标准引入了三个新成员:emplace_front.emplace和emplace_back,这些操作构造而不是拷贝元素.这些操作分 ...

nodejs高并发大流量的设计实现,控制并发的三种方法

nodejs高并发大流量的设计实现,控制并发的三种方法的更多相关文章

随机推荐

热门专题