Node.js(javascript)踩的那些坑

不定期更新中。
最近用node来处理几个长链接问题,用来替换php-fpm,php什么都好,就是维持长链接有问题,如果php-fpm被占用的太多,长时间不响应,则会爆出:
WARNING: [pool www] server reached pm.max_children setting (50), consider raising it
而Node则擅长维持长链接。

字符串的 split(separator, limit)函数(其实是javascript语言的坑)

split函数用来将字符串按照第一个参数separator来分割(可以是字符串或正则表达式),返回分割后的数组,第二个参数limit,用来限制分割后返回的数组数量,这个参数和其他所有已知人类的编程语言都不一样,他并不是用来限定分割次数的,而是,先把字符串全部分割,分割完成后,取前limit个元素。比如把 str字符串变量以空格分割:
str.split(' ', 2); 相当于 str.split(' ').slice(0,2);
这简直是我见到过最丑陋的函数!简直可以称为世界之最奇葩!
因为有很多的场合下,其实只想限定分割次数,比如这样一串字符串:"user-agent: Mozilla/5.0, OS: Mac, Arch: amd64",我只想用正则/:\s+/来分割一次,后面的就别割了。
先看看人类的编程语言们,怎么处理split限定次数,比如Ruby:

2.2.2 :032 > "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/, 2)
 => ["user-agent", "Mozilla/5.0, OS: Mac, Arch:  amd64"] 

很好,返回的很正常,后面的确实没有割。
在看看js返回:

> "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/, 2)
[ 'user-agent', 'Mozilla/5.0, OS' ]

马德,OS后面的被吞掉了!
于是你只能不要后面这个参数,但是还是不行:

> "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/)
[ 'user-agent', 'Mozilla/5.0, OS', 'Mac, Arch', 'amd64' ]

这根本不是想要的,如果仅仅是用字符串来分割,可以把后面的join(': ')一下,但对于正则,解决起来就没有这么简单了,抽空写了一个npm split-limit 包,后来发现有人早就写过了:strsplit 功能差不多。

对象赋值为引用

js中,传递的对象,除基本类型BooleanStringNumberUndefinedNull外,其他类型都是引用,这个虽然是js的入门课,但在项目中,尤其是Node这种Daemon性质的代码中,不注意的话危害很大。
看一段样例代码,有一个http请求封装的函数,每次请求前,用全局的g_headers变量来初始化request的headers,然后再根据传递的参数复写headers

var URL = require('url');
var g_headers = {
  'Cache-Control': 'no-cache',
  'Accept': '*/*',
  'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.10; rv:34.0) Gecko/20100101 Firefox/40.0'
};
function node_fetch(method, url, param, headers) {
  var options = URL.parse(url);
  options.headers = g_headers; // 问题代码,应该用 for(var k in g_headers) 来挨个初始化
  for(var k in headers){
    options.headers[k] = headers[k];
  }
  // request 代码
}

这个函数存在非常大的问题,因为将 g_headers 赋值给了 options.headers 时候,是引用,所以对options.headers的任何改变都会改变全局变量 g_headers,调用多次后,g_headers 已经面目全非了。

Node.js httpServer维持长链接

Node.js创建一个httpServer非常简单,官方例子:

const http = require('http');

const hostname = '127.0.0.1';
const port = 3000;

const server = http.createServer((req, res) => {
  res.statusCode = 200;
  res.setHeader('Content-Type', 'text/plain');
  res.end('Hello World\n');
});

server.listen(port, hostname, () => {
  console.log(`Server running at http://${hostname}:${port}/`);
});

但是我测试长链接的时候,基本上在2分钟左右被强制断开了,后来才查询到,官方文档:
server.timeout
Default = 120000 (2 minutes)
所以需要在维持长链接的http server中增加timeout值:

server.timeout = 10*60*1000; // 10分钟

Node.js响应中文

Node.js响应代码中,输出中文会有问题,常见到的代码是这样:

var headers = {
  'Content-Type': 'text/plain; charset=utf-8',
  'Content-Length': body.length  // 很多样例代码这样写 body.length
}; 
res.writeHead(200, headers);
res.write(body);
res.end();

这段代码的问题是,js对于unicode、中文字符 length返回的是实实在在的字符个数,而不是存储的字节量,而中文值utf-8中是3个字节存储的,还有emoji表情则是4个字节,但content-length指定的应该是响应内容的字节码数量,所以会造成接收端接收不到完整的响应数据,从而出现乱码。
解决代码,用 Buffer.byteLength 替换 length

var headers = {
  'Content-Type': 'text/plain; charset=utf-8',
  'Content-Length': Buffer.byteLength(body, 'utf8')  // 这里不能为 body.length
}; 
res.writeHead(200, headers);
res.write(body);
res.end();

你可能感兴趣的:(Node.js(javascript)踩的那些坑)