脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - python执行js代码的方法

python执行js代码的方法

2021-11-01 10:01Python进阶者 Python

现在为了防止反爬,前端使用的反爬技术比较多的是js代码混淆。python作为爬虫界的扛把子,免不了和js打交道,因此我们需要了解如何使用Python执行js代码

什么是js代码混淆?

正常代码

我们现在看一段js代码,代码逻辑很简单,就是拼接时间返回。

?
1
2
3
4
5
6
7
8
9
10
function formatdate(now) {
    var now = new date(1230999938);
    var year=now.getfullyear();
    var month=now.getmonth()+1;
    var date=now.getdate();
    var hour=now.gethours();
    var minute=now.getminutes();
    var second=now.getseconds();
    return year+"-"+month+"-"+date+" "+hour+":"+minute+":"+second;
}

    运行一下这段代码,如下图所示。

python执行js代码的方法

混淆代码

我随便找了个在线的js代码混淆网站。

js代码

?
1
function formatdate(mz1){var kkkgdih2=new window["\x44\x61\x74\x65"](1230999938);var tsk3=kkkgdih2['\x67\x65\x74\x46\x75\x6c\x6c\x59\x65\x61\x72']();var ymreyp4=kkkgdih2['\x67\x65\x74\x4d\x6f\x6e\x74\x68']()+1;var ozo5=kkkgdih2['\x67\x65\x74\x44\x61\x74\x65']();var qmyec$ed6=kkkgdih2['\x67\x65\x74\x48\x6f\x75\x72\x73']();var jfxvv_akq7=kkkgdih2['\x67\x65\x74\x4d\x69\x6e\x75\x74\x65\x73']();var $mp8=kkkgdih2['\x67\x65\x74\x53\x65\x63\x6f\x6e\x64\x73']();return tsk3+"\x2d"+ymreyp4+"\x2d"+ozo5+" "+qmyec$ed6+"\x3a"+jfxvv_akq7+"\x3a"+$mp8

    上面这个真的不是我瞎写的,混淆之后就是这样子的,不信看图片。

python执行js代码的方法

可能我们会有个疑问,js代码都成这玩意了,还能执行吗? 答案是肯定的。即使js代码非常乱,但还是可以执行的,结果跟上面的是一样的。

这就造成了一个问题,我们在做爬虫时,如果需要,多多少少可能都要研究一下js代码,然后进行js解密一下,但是,但是,要是代码都混淆成了这了,还怎么解?

一点逻辑都看不通了,基本上不可用python按照js逻辑重写出来了...

很巧,小编也是卡在这里...后来我就想,要是python能执行js代码就好了,不用管函数里面的逻辑了,只拿函数返回值就好了。

python第三方包execjs

可能是吧,不止我一个人遇到了这种情况,所以大佬们就开发出来这种工具包,用于执行js代码。

安装

在安装之前,需要有node环境,这里就不举栗子了,下一步下一步就好了。

?
1
pip3 install pyexecjs

执行js

注:由于上述js代码会生成window对象,并不能直接执行成功,需要额外的其他辅助,这里简单的举一下其他例子。

正常js代码

?
1
2
3
function add(x, y) {
   return x + y;
}

python执行js代码

?
1
2
3
4
5
6
7
8
import execjs
 
ctx = execjs.compile("""
function add(x, y) {
  return x + y;
}
""")
print(ctx.call("add"1, 2))

执行结果如下图所示:

python执行js代码的方法

混淆js代码

?
1
function add(bi1,pl$2){return bi1+pl$2}

python执行混淆js代码

?
1
2
3
4
5
6
import execjs
 
ctx = execjs.compile("""
function add(bi1,pl$2){return bi1+pl$2}
""")
print(ctx.call("add"1, 2))

执行结果如下图所示:

python执行js代码的方法

可以看到,即使再混淆,只要执行的是js代码,都是没啥问题的。

上述拼接时间返回的js混淆代码也是可以执行的,但是它多了一个window对象,需要node安装jsdom才行,由于网络设置有问题,实在是下载不了举例子,实在是抱歉。

或者使用selenium打开游览器执行再返回也行,当然,速度更慢。

以上就是python执行js代码的方法的详细内容,更多关于python执行js代码的资料请关注服务器之家其它相关文章!

原文链接:https://mp.weixin.qq.com/s/PV75AMPTE9GTYgfAWXvpzQ

延伸 · 阅读

精彩推荐