PhantomJS抓取内容中文字符乱码问题

PhantomJS默认采用utf-8编码,如果你爬回来的内容输出中文是乱码,多半是编码的锅,改为gbk即可。

有两种方法解决:

1.通过`phantomjs -h`命令可以发现有这么一行

 --output-encoding=<val>              Sets the encoding for the terminal output, default is 'utf8'

也就是运行命令的时候指定就好了:`--output-encoding=gbk`

2.运行时不加参数,在执行脚本里加入一行:

phantom.outputEncoding="gbk";