【解决】PHP为URL地址添加A标签(不提取A和IMG标签内的链接)的解决方案

需要提取的内容如下:

<a href="http://baiwand.com">http://baiwand.com</a>这是第一个A标签,
<a href="http://blog.baiwand.com">成长脚印-专注于互联网发展</a>这是第二个A标签。
http://www.baiwand.com这是第一个需要被提取的URL地址,
http://blog.baiwand.com这是第二个需要被提取的URL地址'。
<img border="0" alt="" src="http://baiwand.com/css/sitelogo_zh-cn.gif">,这是一个IMG标签

类似微博中的自动提取URL为超链接地址。即将红色标记的内容提取出来添加A标签,转换成真正的超链接。网上搜索了很久,没有找到一个切实可行的解决方案。大都只是简单的提取URL(A标签和IMG标签内的地址也被提取替换了),并不能满足以上需求。正则表达式中也没发现能够实现提取时过滤掉A标签的方法。于是转换了一下思路,“曲线救国”。即,先将所有的A标签和IMG标签正则替换为某一个统一的标记,然后再提取URL地址替换为超链接,最后再将统一的标记还原替换为以前的A标签和IMG标签便解决了。

方案代码如下:

function linkAdd($content){
	//提取替换出所有A标签(统一标记<{link}>)
	preg_match_all('/<a.*?href=".*?".*?>.*?<\/a>/i',$content,$linkList);
	$linkList=$linkList[0];
	$str=preg_replace('/<a.*?href=".*?".*?>.*?<\/a>/i','<{link}>',$content);

	//提取替换出所有的IMG标签(统一标记<{img}>)
	preg_match_all('/<img[^>]+>/im',$content,$imgList);
	$imgList=$imgList[0];
	$str=preg_replace('/<img[^>]+>/im','<{img}>',$str);
	
	//提取替换标准的URL地址
	$str=preg_replace('(((f|ht){1}tp://)[-a-zA-Z0-9@:%_/+.~#?&//=]+)','<a href="\\0" target="_blank">\\0</a>',$str);
	
	//还原A统一标记为原来的A标签
	$arrLen=count($linkList);
	for($i=0;$i<$arrLen;$i++){
		$str=preg_replace('/<{link}>/',$linkList[$i],$str,1); 
	}
	
	//还原IMG统一标记为原来的IMG标签
	$arrLen2=count($imgList);
	for($i=0;$i<$arrLen2;$i++){
		$str=preg_replace('/<{img}>/',$imgList[$i],$str,1); 
	}
	
	return $str;
}

$content='
<a href="http://baiwand.com">http://baiwand.com</a>这是第一个A标签,
<a href="http://blog.baiwand.com">成长脚印-专注于互联网发展</a>这是第二个A标签。
http://www.baiwand.com这是第一个需要被提取的URL地址,
http://blog.baiwand.com这是第二个需要被提取的URL地址。
<img border="0" alt="" src="http://baiwand.com/css/sitelogo_zh-cn.gif">,这是一个IMG标签';
echo linkAdd($content);

返回的内容为:

<a href="http://baiwand.com">http://baiwand.com</a>这是第一个A标签, <a href="http://blog.baiwand.com">成长脚印-专注于互联网发展</a>这是第二个A标签。 <a href="http://www.baiwand.com" target="_blank">http://www.baiwand.com</a>这是第一个需要被提取的URL地址, <a href="http://blog.baiwand.com" target="_blank">http://blog.baiwand.com</a>这是第二个需要被提取的URL地址。
<img border="0" alt="" src="http://baiwand.com/css/sitelogo_zh-cn.gif">,这是一个IMG标签
即为我们想要的内容。

 

【参考】

用php正则判断url地址并自动转换为超链接


阅读本文后,您的心情是:
 
恶心
愤怒
强赞
感动
路过
无聊
雷囧
关注
知识共享许可协议
评论(0) 浏览(23354) 引用(0)
引用地址:http://blog.baiwand.com/tb.php?sc=36738e&id=150
Tags:
« 【解决】AJAX前进后退按钮失效,及刷新问题的解决方案 【经验】Mysql的IFNULL及IN操作 »

Blogger

  • blogger
  • 天之骄子
  • 职位:研发工程师
    铭言:
    阳光与欢乐同在,
    与我同在
    主页:
    blog.baiwand.com

分类目录

日志归档

主题标签

数据统计

  • 日志:151篇
  • 评论:45条
  • 碎语:264条
  • 引用:0条

链接表

随机日志 »

最新日志 »

最新评论 »

标签云 »

订阅Rss
sitemap