Delphi 爬网页速度慢

2024-08-23

delphi 7中使用idhttp抓取网页解决假死现象

在delphi 7中使用idhttp抓取网页,造成窗口无反应的假死状态.通过搜索获得两种方法. 1.写在线程中,但是调用比较麻烦 2.使用delphi 提供的idantifreeze(必须安装indy).在indy misc中将idfreeantifreeze放入程序中, 将OnlyWhenIdle状态修改为False即可.方便简单. ===================================== 直接采用Delphi自带Control控件INDY组件为例.新建个工程,放上个TIdH

DELPHI读取网页源文件和获取字符串

说到网页采集,通常大家以为到网上偷数据,然后把到收集到的数据挂到自己网上去.其实也可以将采集到的数据做为公司的参考,或把收集的数据跟自己公司的业务做对比等.目前网页采集多为3P代码为多(3P即ASP.PHP .JSP).用得最有代表的就动易科技公司BBS中新闻采集系统,和网上流传的新浪新闻采集系统等都是用ASP程序来使用,但速度从理论上来说不是很好.如果尝试用其它软件的多线程采集是不是更快?答案是肯定的.用DELPHI.VC.VB.JB都可以,PB似乎比较不好做.以下用DELPHI来解释采集网页

python学习道路(day11note)(协程,同步与异步的性能区别,url爬网页,select,RabbitMq)

1.协程 #协程又称微线程是一种用户的轻量级线程程序级别代码控制就不用加机器 #不同函数 = 不同任务 A函数切到B函数没有进行cpu级别的切换,而是程序级别的切换就是协程 yelied #单线程下多个任务流用协程,比如打电话可以切换,nginx #爽妹给你打电话的时候,她不说话,刘征电话过来时候你可以切过去,这时候要是爽妹说话,就会bibi响 ''' 协程的好处: 无需线程上下文切换的开销无需原子操作锁定及同步的开销 "原子操作(atomic operation)是不需要synchr

爬网页？--Chrome帮你计算XPath

最近用HtmlUnit/HtmlCleaner爬网页,这两个工具都使用XPath来定位html元素.发现chrome竟然有算出XPath的功能! 打开一个网页,F12,在弹出的小窗口中选中一个标签,右键,看到“copy XPath”了吧! 对chrome的崇敬之情++

Python3.x爬虫教程：爬网页、爬图片、自己主动登录

林炳文Evankaka原创作品. 转载请注明出处http://blog.csdn.net/evankaka 摘要:本文将使用Python3.4爬网页.爬图片.自己主动登录.并对HTTP协议做了一个简单的介绍.在进行爬虫之前,先简单来进行一个HTTP协议的解说.这样以下再来进行爬虫就是理解更加清楚. 一.HTTP协议 HTTP是Hyper Text Transfer Protocol(超文本传输协议)的缩写. 它的发展是万维网协会(World Wide Web Consortium)和Intern

delphi : 取得网页源码内容

取得网页的源码内容的函数以及调用方法供大家参考: program geturl; uses wininet, windows; //取网页内容 function StrPas(const Str: PChar): string; begin Result := Str; end; function GetWebPage(const Url: string):string; var Session, HttpFile:HINTERNET; szSizeBuffer:Pointer; dwLengt

提高Delphi的编译速度（bpl和bcp）

delphi的编译速度提高(一) 此博文为原创,转载请注明出处作者 :二娃此博文的内容我曾经回答群内和论坛内的网友提问时回答过,现在写第一部分,第二部分,我再给出一个终极的提高速度的方法我用过delphi 7,delphi2005,2006,2007 现在零星地用用2009以及2010,但是无论用哪种版本,其中第三方控件是少不了的,可是随之而来的问题是,每多用一种类型的第三方控件,delphi的编辑和代码提示速度降低一些,到最后,像代码提示(实际上也是编译或者预编译)有时弹出提示内容竟要花

协程demo，1异步爬网页 2异步socket请求

一.异步爬网页 ''' 协程并发爬网页 ''' from urllib import request import gevent,time from gevent import monkey # 让gevent知道urllib里的哪些操作属于IO操作 monkey.patch_all() # 标记当前程序所有的IO操作 def f(url): print("GET:{0}".format(url)) resp = request.urlopen(url) data = resp.rea

Java爬网页数据，并存储到本地数据库中

由于开发一个人工智能项目,需要强大的后台数据库加持,所以,没有办法,又是需要医疗数据,只能自己爬某医疗网站数据,进行分析,但是由于不同网站的结构不一样,所以这个程序只能爬该网站的,第一次爬网页数据,自己写的底层分析处理源码,不能当做你们的爬数据工具,但是可以进行学习,毕竟是底层级别的,也很简单,放到这里,免费交流,免费下载源码,我放到GitHub上去了. https://github.com/ChangeYD/changeMax 这是爬下来的数据,很多,我也分类了几张表.

【python】-- 协程介绍及基本示例、协程遇到IO操作自动切换、协程（gevent）并发爬网页

协程介绍及基本示例协程,又称微线程,纤程.英文名Coroutine.一句话说明什么是协程:协程是一种用户态的轻量级线程. 协程拥有自己的寄存器上下文和栈.协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈.因此: 协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次调用的状态,换种说法:进入上一次离开时所处逻辑流的位置. 协程的好处: 无需线程上下文切换的开销无需原子操作锁定及同步的开销 "原子操作(a

Delphi调用网页美化SQL

百度搜索在线美化SQL语句的网站,为了加快解析速度,这里已下载到本地. 然后delphi用webbrowse载入本地的网页,然后把sql传进去,美化后取出来. 效果如下图点击下载源码

简单修改hosts文件加快打开网页速度

这个电脑小技巧的帖子菲菲博客分享如何通过简单一招利用修改系统的hosts文件来实现有效加快浏览器打开网页的速度.尤其是网络繁忙时DNS服务器负担加重的时候效果特别明显,有兴趣就和菲菲一起来学习一下吧,以下已提升百度的打开速度为例讲解:第一步:打开开始菜单-运行,输入cmd回车打开命令行dos窗口,然后输入ping www.baidu.com(注意两者之间有个空格!)再次回车我们获得百度服务器ip地址.如下图第二步:再次打开开始菜单里的运行,输入以下命令: 按下回车键后即可打开我们的电脑hosts

delphi 16 网页缩放

网页放大网页缩小 WebBrowser1.OleObject.Document.Body.Style.Zoom := 0.50; 缩放网页 Ctrl+中键↑ 放大 Ctrl+中键↓ 缩小 const OLECMDID_OPTICAL_ZOOM = 63;var ZoomIn: OleVariant;begin ZoomIn := 10; WebBrowser1.ExecWB(OLECMDID_OPTICAL_ZOOM, OLECMDEXECOPT_DODEFAULT,

delphi 读网页线程TReadHtmlThread

读网页,通常是一个耗时操作.故把读网页放入线程是显得比较重要了. 本例用改进后的 TIdhttpEx 加上线程来实现读网页. 它的父类TSimpleThread 在此本例程源码在此源码中包含了所有的支持单元,其它单元后续会慢慢讲解 unit uReadHtmlThread; interface uses uSimpleThread, uIdhttpEx; type TReadHtmlThread = class; // 提前申明 TReadHtmlThread 是一个类,后面好办事 TRea

使用Openresty加快网页速度

新年快乐~~~ 上一篇文章讲到使用多级缓存来减少数据库的访问来加快网页的速度,只是,仍旧没有"嗖"一下就加载出来的感觉,想再优化一下,优化代码什么的已经到了极限.上周无意中看到了openresty,能够直接在nginx层直接对请求处理,而不需要每次都访问tomcat,特别是对于自己的首页http://www.wenzhihuai.com来说,由于首页内容广泛,需要涉及的方法太多,每次打开首页都得耗费大量的时间. 一.整体架构目前本人总共有三个服务器: A:119.23.46.71(深

Python3 中爬网页 \uxxx 问题

今天上午在没事儿爬一下我自己的博客主页文章练习下.在写入的时候遇到的编码问题,折腾了半天 ,记录一下 import urllib.request import time str1 = urllib.request.urlopen('https://www.cnblogs.com/thelovelybugfly/').read().decode('utf-8') url = ['']*10 i = 0 title = str1.find(r'postTitle2') href = str1.fin

Delphi访问网页中的下拉菜单

Delphi通过TWebBrowser浏览网页,然后访问该网页中的下拉菜单: uses MsHtml;procedure TForm1.Button1Click(Sender: TObject);var doc: IHTMLDocument2; coll: IHTMLElementCollection; iPos, iIndex: Integer; selElem: IHtmlSelectElement; optElem: IHtmlOptionElement;begin doc :

python爬虫13 | 秒爬，这多线程爬取速度也太猛了，这次就是要让你的爬虫效率杠杠的

快快了啊嘿小老弟想啥呢今天这篇爬虫教程的主题就是一个字快想要做到秒爬就需要知道什么是多进程什么是多线程什么是协程(微线程) 你先去沏杯茶坐下来小帅b这就好好给你说道说道关于线程这玩意沏好茶了吗那么接下来就是学习 python 的正确姿势首先我们来了解什么是进程进程就是正在运行的程序比如你的系统现在运行着的微信就是一个进程一旦你的「微信」运行起来系统就会给「微信」分配了内存和资源那什么是单进程呢? 单进程就是说你的电脑只能做一件事情比如你在电

python爬网页中文乱码问题

再用python爬取网页时,用模拟浏览器登陆,得到的中文字符出现乱码,该怎么解决呢? url = “http://newhouse.hfhouse.com/” req = urllib2.Request(url,headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; rv:24.0) Gecko/20100101 Firefox/24.0" }) reqHtml = urllib2.urlopen(req).re

delphi 获取网页源代码

//获取网页源代码 var s: string; begin s := WebBrowser1.OleObject.document.body.innerHTML; //body内的所有代码 s := WebBrowser1.OleObject.document.body.outerHTML; //body内的所有代码, 包含body标签 s := WebBrowser1.OleObject.document.documentElement.innerHTML; //html内的

Delphi ADOQuery的速度优化转

今天终于把纠缠了几天的问题改完了,说到底只是一个很小的问题,就是ADOQuery的一个小属性. 把控件DBGridEh的一列的checkbox设为true,将其绑定DataSourceA和DOQuery.用Button添加了一个事件,用来取消对checkbox的操作:ADOQuery.CancelBatch():可是只能取消最后一步的操作.检查了很长时间才发现在DBGridEh的DataSource的Dataset 下的LockType的属性设置问题,我设置成了:ItOptimistic

Delphi 爬网页速度慢

热门专题