phpcurl多线程(php 多线程)

http://www.itjxue.com  2023-01-29 05:38  来源:未知  点击次数: 

curl多线程与单线程区别

线程是编程上的抽象概念,又叫执行绪。

但curl的多线程,特指curl包本身可以同时发出多个http请求,可以同时获得不同的文件(或响应),或一个文件(或响应)的多段内容。

curl的单线程,就是一次只能发出一个http请求,接收完这个请求的回应才能请求下一次http。

curl的线程由该库的c语言依赖库提供的,和调用curl的其他语言环境没有关系。

PHP-php 怎么实现类似多线程

php本身不支持多线程,但可以通过curl_multi_*系列函数来模拟多线程,以下是我用过的一个函数,但请求不能过多,否则会出现一些难以解释的问题。希望对你有帮助。

?php

function rolling_curl($urls, $delay) {

$queue = curl_multi_init();

$map = array();

foreach ($urls as $url) {

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $url);

curl_setopt($ch, CURLOPT_TIMEOUT, 1);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_HEADER, 0);

curl_setopt($ch, CURLOPT_NOSIGNAL, true);

curl_multi_add_handle($queue, $ch);

$map[(string) $ch] = $url;

}

$responses = array();

do {

while (($code = curl_multi_exec($queue, $active)) == CURLM_CALL_MULTI_PERFORM) ;

if ($code != CURLM_OK) { break; }

// a request was just completed -- find out which one

while ($done = curl_multi_info_read($queue)) {

// get the info and content returned on the request

$info = curl_getinfo($done['handle']);

$error = curl_error($done['handle']);

$results = callback(curl_multi_getcontent($done['handle']), $delay);

$responses[$map[(string) $done['handle']]] = compact('info', 'error', 'results');

// remove the curl handle that just completed

curl_multi_remove_handle($queue, $done['handle']);

curl_close($done['handle']);

}

// Block for data in / output; error handling is done by curl_multi_exec

if ($active 0) {

curl_multi_select($queue, 0.5);

}

} while ($active);

curl_multi_close($queue);

return $responses;

}

function callback($data, $delay) {

preg_match_all('/h3(.+)\/h3/iU', $data, $matches);

usleep($delay);

return compact('data', 'matches');

}

$urls = array();

for($i=0;$i5;$i++)

{

array_push($urls,"");

}

rolling_curl($urls, 0.5);

使用curl实现多线程

?php

/*

curl 多线程抓取

*/

/**

* curl 多线程

*

* @param array $array 并行网址

* @param int $timeout 超时时间

* @return array

*/

functionCurl_http($array,$timeout){

$res=array();

$mh= curl_multi_init();//创建多个curl语柄

$startime= getmicrotime();

foreach($arrayas$k=$url){

$conn[$k]=curl_init($url);

curl_setopt($conn[$k], CURLOPT_TIMEOUT,$timeout);//设置超时时间

curl_setopt($conn[$k], CURLOPT_USERAGENT,'Mozilla/5.0 (compatible; MSIE 5.01; Windows NT 5.0)');

curl_setopt($conn[$k], CURLOPT_MAXREDIRS, 7);//HTTp定向级别

curl_setopt($conn[$k], CURLOPT_HEADER, 0);//这里不要header,加块效率

curl_setopt($conn[$k], CURLOPT_FOLLOWLOCATION, 1);// 302 redirect

curl_setopt($conn[$k],CURLOPT_RETURNTRANSFER,1);

curl_multi_add_handle ($mh,$conn[$k]);

}

//防止死循环耗死cpu 这段是根据网上的写法

do{

$mrc= curl_multi_exec($mh,$active);//当无数据,active=true

}while($mrc== CURLM_CALL_MULTI_PERFORM);//当正在接受数据时

while($activeand$mrc== CURLM_OK) {//当无数据时或请求暂停时,active=true

if(curl_multi_select($mh) != -1) {

do{

$mrc= curl_multi_exec($mh,$active);

}while($mrc== CURLM_CALL_MULTI_PERFORM);

}

}

foreach($arrayas$k=$url) {

curl_error($conn[$k]);

$res[$k]=curl_multi_getcontent($conn[$k]);//获得返回信息

$header[$k]=curl_getinfo($conn[$k]);//返回头信息

curl_close($conn[$k]);//关闭语柄

curl_multi_remove_handle($mh,$conn[$k]);//释放资源

}

curl_multi_close($mh);

$endtime= getmicrotime();

$diff_time=$endtime-$startime;

returnarray('diff_time'=$diff_time,

'return'=$res,

'header'=$header

);

}

//计算当前时间

functiongetmicrotime() {

list($usec,$sec) =explode(" ",microtime());

return((float)$usec+ (float)$sec);

}

//测试一下,curl 三个网址

$array=array(

" ",

" ",

" "

);

$data= Curl_http($array,'10');//调用

var_dump($data);//输出

?

(责任编辑:IT教学网)

更多

推荐数据库文章