Python爬虫入门教程 42-100 爬取儿歌多多APP数据-手机APP爬虫部分

梦想橡皮擦 2024-08-25 10:11:52 原文

1. 儿歌多多APP简单分析

今天是手机APP数据爬取的第一篇案例博客，我找到了一个儿歌多多APP，没有加固，没有加壳，没有加密参数，对新手来说，比较友好，咱就拿它练练手，熟悉一下Fiddler和夜神模拟器是如何配合着使用的。

儿歌多多APP在豌豆荚的下载量还是可以的，一家做内容的APP。

2. APP安装和使用

APP直接去下载APK包就可以了，拖拽到夜神模拟器就安装成功了。在模拟器打开出现如下界面，表示已经可以开始操作了,非常儿童的APP。

3. 抓包测试

打开APP同时，打开Fiddler，首先测试一下网络是否正常，用模拟器自带的浏览器去访问百度，如果可以访问表示无问题，否则重新设置代理

运行软件过程中，注意观察Fiddler，如果出现JSON类型的API[接口]，就要注意了，你想要的数据就在这里

我们点击链接，看Fiddler右侧显示内容，主要看我标注的3处重点

分别是链接，请求头，响应内容

4. 提取接口链接

获取到上述地址之后，你就可以提取接口地址了，提取到的接口很长，需要我们进行关键参数的判定

http://bb.ergeduoduo.com/baby/bb.php?type=getvideos&collectid=29&interver=8&page=1&pagesize=30&grade=-1_-1&user=866174010820641&prod=childstory_ar_4.0.5.0&corp=duoduo&source=childstory_ar_4.0.5.0_m360&srcver=story&ver=1&imei=866174010820641&protect=1

经过一系列的测试，缩短链接如下

http://bb.ergeduoduo.com/baby/bb.php?type=getvideos&collectid=29&page=1&pagesize=30

关键参数

type # 获取内容类型

collectid # 分类

page = 1 # 页码

pagesize = 30 # 每页数据

5. 儿歌多多APP数据爬虫编写

关键地址拿到之后，下面的操作就是选择一个你熟悉的爬虫库去进行操作了，你可以使用scrapy,pyspider 等，也可以直接用requests直接去爬取，都是非常简单的，我就不进行爬虫部分的编写了~

6. 本篇博客重点内容

通过儿歌多多，希望你可以把Fiddler和夜神模拟器之间的配合进行抓包。工具使用熟练，只要接口被我们获取到，关键参数被我们提取到，我们就可以快速的编写爬虫去获取它内部的数据了。

在爬取的过程中，还可以直接去下载视频哦

欢迎关注微信：非本科程序员

Python爬虫入门教程 42-100 爬取儿歌多多APP数据-手机APP爬虫部分的更多相关文章

Python爬虫入门教程 47-100 mitmproxy安装与安卓模拟器的配合使用-手机APP爬虫部分
1. 准备下载软件介绍一款爬虫辅助工具mitmproxy ,mitmproxy 就是用于MITM的proxy,MITM中间人攻击.说白了就是服务器和客户机中间通讯多增加了一层.跟Fiddler和Ch ...
Python爬虫入门教程 27-100 微医挂号网专家团队数据抓取pyspider
1. 微医挂号网专家团队数据----写在前面今天尝试使用一个新的爬虫库进行数据的爬取,这个库叫做pyspider,国人开发的,当然支持一下. github地址: https://github.com ...
Python爬虫入门教程 43-100 百思不得姐APP数据-手机APP爬虫部分
1. Python爬虫入门教程爬取背景 2019年1月10日深夜,打开了百思不得姐APP,想了一下是否可以爬呢?不自觉的安装到了夜神模拟器里面.这个APP还是比较有名和有意思的. 下面是百思不得姐的 ...
Python爬虫入门教程 37-100 云沃客项目外包网数据爬虫 scrapy
爬前叨叨 2019年开始了,今年计划写一整年的博客呢~,第一篇博客写一下一个外包网站的爬虫,万一你从这个外包网站弄点外快呢,呵呵哒数据分析官方网址为 https://www.clouderwor ...
Python爬虫入门教程 64-100 反爬教科书级别的网站-汽车之家，字体反爬之二
说说这个网站汽车之家,反爬神一般的存在,字体反爬的鼻祖网站,这个网站的开发团队,一定擅长前端吧,2019年4月19日开始写这篇博客,不保证这个代码可以存活到月底,希望后来爬虫coder,继续和汽车之 ...
python爬虫入门新手向实战 - 爬取猫眼电影Top100排行榜
本次主要爬取Top100电影榜单的电影名.主演和上映时间, 同时保存为excel表个形式, 其他相似榜单也都可以依葫芦画瓢首先打开要爬取的网址https://maoyan.com/board/4, ...
Python爬虫入门教程 46-100 Charles抓取手机收音机-手机APP爬虫部分
1. 手机收音机-爬前叨叨今天选了一下,咱盘哪个APP呢,原计划是弄荔枝APP,结果发现竟然没有抓到数据,很遗憾,只能找个没那么圆润的了.搜了一下,找到一个手机收音机下载量也是不错的. 2. 爬虫 ...
Python爬虫入门教程 45-100 Charles抓取兔儿故事-下载小猪佩奇故事-手机APP爬虫部分
1. Charles抓取兔儿故事背景介绍之前已经安装了Charles,接下来我将用两篇博客简单写一下关于Charles的使用,今天抓取一下兔儿故事里面关于小猪佩奇的故事. 爬虫编写起来核心的重点是分 ...
Python爬虫入门教程 32-100 B站博人传评论数据抓取 scrapy
1. B站博人传评论数据爬取简介今天想了半天不知道抓啥,去B站看跳舞的小姐姐,忽然看到了评论,那就抓取一下B站的评论数据,视频动画那么多,也不知道抓取哪个,选了一个博人传跟火影相关的,抓取看看.网址 ...

随机推荐

Day1----Python学习之路笔记（1）
学习路线 Day1 Day2 Day3 Day4 Day5 ...待续一.了解开发语言 1.高级语言:Python,Java,C++,C#,PHP,JS,Go,Ruby,SQL,Swift,Perl ...
在C++中怎么输入反斜杠“ \ ”
在C++编程中有时就会遇到有些符号不能直接输入,像反斜杠“ \ ",如果直接输入会出现:错误的终止了宏调用的错误. 这时,我们就需要把这些符号转义一下, 例如: CString str = ...
SM干货篇：你应该具备的提问技巧！
在成为Scrum Master(SM)之前,我曾担任过许多团队的技术负责人.工作内容之一就是做决定,而且我认为自己做得挺好:坚定果断是我性格的一部分. 然而,当我成为Scrum Master之后,这样 ...
Android 应用加固（乐固）操作说明
此处引用腾讯云对加固的优点说明如下: 为什么应用需要加固? 若应用不做任何安全防护,极易被病毒植入.广告替换.支付渠道篡改.钓鱼.信息劫持等,严重侵害开发者的利益. 应用进行安全防护,防止应用分发后, ...
window 7 安装Jmeter并配置https录制脚本
安装与环境配置: http://blog.csdn.net/hhuangdanfeng/article/details/51564765 http://blog.csdn.net/u010573212 ...
关于socket.io的使用
这段时间学习了socket.io,用它写了小项目,在此总结下它的基本使用方式和一些要点. socket.io是基于Node.js和WebSocket协议的实时通信开源框架,它包括客户端的JavaScr ...
影响HTTP性能的常见因素
影响HTTP性能的常见因素我们这里讨论HTTP性能是建立在一个最简单模型之上就是单台服务器的HTTP性能,当然对于大规模负载均衡集群也适用毕竟这种集群也是由多个HTTTP服务器的个体所组成.另外我们 ...
从壹开始微服务 [ DDD ] 之十二 ║ 核心篇【下】：事件驱动EDA 详解
缘起哈喽大家好,又是周二了,时间很快,我的第二个系列DDD领域驱动设计讲解已经接近尾声了,除了今天的时间驱动EDA(也有可能是两篇),然后就是下一篇的事件回溯,就剩下最后的权限验证了,然后就完结了, ...
将本地文件传输到GitHub
统一概念: 工作区:增删文件和内容暂存区:键入命令 git add 改动的文件,此次改动就放到了『暂存区』本地仓库 :键入命令 git commit ,此次改动就放到了『本地仓库』,每个 com ...
虚拟机设置静态IP配置
网关虚拟机的ip设置 vi /etc/sysconfig/network-scripts/ifcfg-eth0 重启网卡 service network restart 测试 ping www.b ...