爬取WX小程序的数据

方法一：

使用TBS工具，调试跟踪获取URL

https://x5.tencent.com/tbs/guide/debug/download.html

https://x5.tencent.com/tbs/guide/debug/season1.html

方法二：

下载小程序的包，反编译，查看代码或者用微信开发者工具调试跟踪

1、node.js运行环境

如果没有安装nodejs，请先安装一下
下载地址：https://nodejs.org/en/

2、反编译的脚本

这里提供一个Github上qwerty472123大神写的node.js版本的，当然也有其它版本的，例如python版本，这里我只是简单地用node.js版本举例
地址：https://github.com/qwerty472123/wxappUnpacker

3、安卓模拟器（要求自带root权限）

我使用的是夜神模拟器，你也可以自选
下载地址：https://www.yeshen.com/cn/download/fullPackage、

4、下载包

在模拟器微信中运行一下后，直接切回模拟器桌面，运行RE浏览器来到目录
根目录/data/data/com.tencent.mm/MicroMsg/{一串16进制字符}/appbrand/pkg/
把包压缩成zip，并传到电脑

5、反编译

在node命令窗口中安装依赖：npm install
安装好依赖之后，就是最后一步了，反编译 .wxapkg 文件
在当前目录下输入
node wuWxapkg.js [-d] <files…> //files就是你想要反编译的文件名
例如：我有一个需要反编译的文件 _163200311_32.wxapkg 已经解压到了D盘根目录下,那么就输出命令
node .\wuWxapkg.js D:\_163200311_32.wxapkg

6、使用微信开发者工具打开并调试，需要有微信号登录，并设置可信域名(域名一般在代码的config.js里面)

开发工具下载网址：https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html
设置可信域名：https://mp.weixin.qq.com/
开发工具说明：　https://developers.weixin.qq.com

爬取WX小程序的数据的更多相关文章

python爬取微信小程序（实战篇）
python爬取微信小程序(实战篇) 本文链接:https://blog.csdn.net/HeyShHeyou/article/details/90452656 展开一.背景介绍近期有需求需要抓 ...
Python爬取微信小程序（Charles）
Python爬取微信小程序(Charles) 本文链接:https://blog.csdn.net/HeyShHeyou/article/details/90045204 一.前言最近需要获取微信小 ...
scrapy爬取微信小程序社区教程（crawlspider）
爬取的目标网站是: http://www.wxapp-union.com/portal.php?mod=list&catid=2&page=1 目的是爬取每一个教程的标题,作者,时间和 ...
scarpy crawl 爬取微信小程序文章（将数据通过异步的方式保存的数据库中）
import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlSpider ...
scarpy crawl 爬取微信小程序文章
import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlSpider ...
burpsuite抓取小程序的数据包（指定DNS）
目标:burpsuite抓取微信小程序的数据包,而且该系统需指定DNS!否则无法访问! 大家都知道小程序是https传输的,所以手机端是需要安装burp证书的. 已忽略安装证书的步骤,可自己百度搜索, ...
小程序的数据存储，与Django等服务发送请求
目录官方文档快速归纳存取改删 1.wx存储数据到本地以及本地获取数 1.1 wx.setStorageSync(string key, any data) 存(同步) 1.2 wx.setSto ...
Java爬虫系列四：使用selenium-java爬取js异步请求的数据
在之前的系列文章中介绍了如何使用httpclient抓取页面html以及如何用jsoup分析html源文件内容得到我们想要的数据,但是有时候通过这两种方式不能正常抓取到我们想要的数据,比如看如下例子. ...
python爬取快手小姐姐视频
流程分析一.导入需要的三方库 import re #正则表表达式文字匹配 import requests #指定url,获取网页数据 import json #转化json格式 import os ...

随机推荐

Nginx 单个进程允许的最大连接数
(1) 控制 Nginx 单个进程允许的最大连接数的参数为 worker_connections ,这个参数要根据服务器性能和内存使用量来调整 (2) 进程的最大连接数受 Linux 系统进程的最大打 ...
opcode cache与JIT的区别
要说明opcode cache与JIT的区别,得先明白,字节码,又叫中间码与机器码的区别. 操作码(opcode) 一条机器指令.比如我们汇编语言写的一条操作语句. 机器码(machine code) ...
oracle 11g安装过程
1,工具:Oracle_win64_11gR2_database(64位oracle 11g数据库).iso安装文件,win10系统 2,右键,解压后,点击setup.exe,系统会检测本机的环境,如 ...
JavaScript 注意要点
何时加引号: 只有变量不加引号.加了引号的一定不是变量,是字符方法: 方法一律带有小括号 js 中的作用域全局变量: 在最外层定义的变量: 在函数体内部看是没有声明var的也是全局 ...
Linux下pn532板子测试学校水卡
0x01买板子最便宜的板子pn532,需要买usb转串口的设备,对于kali-rolling,好像是通杀的,无论是PL2303,ch34X,FT232RL(没测试,这个更高端应该没问题),cp210 ...
c++ 网络库
1.libevent 2.boost::asio 3.ace boost::asio以前看过,不过忘记了学习,学习
小妖精的完美游戏教室——东方project，同人，自机
//================================================================ //// Copyright (C)// All Rights R ...
SQL-记录-005
对于记录的操作涉及的知识比较多,分多篇文章进行梳理. 记录创建篇:记录删除篇:记录修改篇:记录查询篇:
成功的拆开了SELECT里JOIN个SELECT是啥
SELECT * FROM table JOIN table ON a=b ----------------------- JOIN (SELECT* FROM table JOIN table ON ...
BIOS + MBR > UEFI + GPT
BIOS + MBR > UEFI + GPT硬件接口系统与磁盘分区UEFI用于取代老旧的BIOS,而GPT则取代老旧的MBR. 名词解释: BIOS (Basic Input/Output S ...

爬取WX小程序的数据

爬取WX小程序的数据的更多相关文章

随机推荐

热门专题