标签搜索

PHP实现简单采集

Migi
2022-05-05 / 0 评论 / 30 阅读 / 正在检测是否收录...
<?php 
for ($k=2; $k < 8; $k++) { 
//选择你要爬的url 找到变量的规律(一般都是伪静态) 实现批量采集 这里用循环爬取6页
$subject="https://edu.51cto.com/courselist/286/p".$k.".html?cate_id=0";
//匹配你要采集的内容 找到变量 将变量替换成(.*?) 记得转义特殊字符
$pattern='/<div class="title" title="(.*?)">(.*?)<\/div>/';
//爬取网页的内容并且把它放入变量 注意要开启php openssl扩展
$str=file_get_contents($subject);
//进行正则匹配规则 匹配我们想要的内容 将匹配的内容放入一个二维数组$res
$int=preg_match_all($pattern,$str,$res); //$int代表匹配到的个数
//循环输出二维数组里面的每个元素 
for ($i=0; $i<$int;$i++)
{echo $res[0][$i];}
}
?>
4

评论 (0)

取消