php把采集内容中图片地址下载并替换成本地地址

点击数：13032015-07-22 14:42:10　来源: 外贸网站建设,深圳外贸网站建设,深圳网站建设,外贸商城网站制作-亿恩科技

新闻摘要:如果你不是使用工具采集而是直接使用php来采集文章,这样文章中的地址如果我们下载下来不替换的还是别人网站的地地址,下面我来介绍利用preg_match_all函数不定期把采集内容中图片地址

如果你不是使用工具采集而是直接使用php来采集文章,这样文章中的地址如果我们下载下来不替换的还是别人网站的地地址,下面我来介绍利用preg_match_all函数不定期把采集内容中图片地址下载并替换成本地地址.

把字符串中地址全部获取到一个数组我们利用preg_match_all函数,代码如下:

<?php

$str='<p><img border="0" src="upfiles/2009/07/1246430143_1.jpg" alt=""/></p>';

$pattern="/<[img|IMG].*?src=['|"](.*?(?:[.gif|.jpg]))['|"].*?[/]?>/";

preg_match_all($pattern,$str,$match);print_r($match);

?>

//结果

Array

(

    [0] => Array

        (

            [0] => <img border="0" src="upfiles/2009/07/1246430143_1.jpg" alt=""/>

        )

    [1] => Array

        (

            [0] => upfiles/2009/07/1246430143_1.jpg

        )

)

有了上面核心函数下面就好做了,代码如下:

/**

* 获取替换文章中的图片路径

* @param string $xstr 内容

* @param string $keyword 创建照片的文件名

* @param string $oriweb 网址

* @return string

*

*/

function replaceimg($xstr,$keyword, $oriweb){

    //保存路径

    $d = date('Ymd', time());

    $dirslsitss = '/var/www/weblist/uploads/'.$keyword.'/'.$d;//分类是否存在

    if(!is_dir($dirslsitss)) {

        @mkdir($dirslsitss, 0777);

    }

    //匹配图片的src

    preg_match_all('#<img.*?src="([^"]*)"[^>]*>#i', $xstr, $match);

    foreach($match[1] as $imgurl){

        $imgurl = $imgurl;

        if(is_int(strpos($imgurl, 'http'))){

            $arcurl = $imgurl;

        } else {

            $arcurl = $oriweb.$imgurl;

        }

        $img=file_get_contents($arcurl);

        if(!emptyempty($img)) {

            //保存图片到服务器

            $fileimgname = time()."-".rand(1000,9999).".jpg";

            $filecachs=$dirslsitss."/".$fileimgname;

            $fanhuistr = file_put_contents( $filecachs, $img );

            $saveimgfile = "/uploads/$keyword"."/".$d."/".$fileimgname;

            $xstr=str_replace($imgurl,$saveimgfile,$xstr);

        }

    }

    return $xstr;

}

【责任编辑：】(Top) 返回页面顶端

下一篇：.htaccess与php判断手机/电脑访问手机页面

上一篇：php中curl破解图片防盗链

栏目导航

Navigation

亿恩科技—企业信息化一站式服务专家

返回顶部
0755-27515592
在线咨询
微信二维码

PHP教程

php把采集内容中图片地址下载并替换成本地地址

新闻摘要:如果你不是使用工具采集而是直接使用php来采集文章,这样文章中的地址如果我们下载下来不替换的还是别人网站的地地址,下面我来介绍利用preg_match_all函数不定期把采集内容中图片地址

下一篇：.htaccess与php判断手机/电脑访问手机页面

上一篇：php中curl破解图片防盗链

栏目导航

最新更新

亿恩科技—企业信息化一站式服务专家