关于织梦(DedeCMS)采集过滤的万能代码,以下是一个基本的示例,这个代码并不是“万能”的,因为每个网站的采集需求可能都不同,但以下代码可以作为基础,根据具体需求进行调整。
<?php //织梦dedecms采集过滤万能代码 function dede_filter($content) { // 过滤HTML标签 $content = strip_tags($content); // 过滤XSS攻击 $content = htmlspecialchars($content, ENT_QUOTES, 'UTF8'); // 过滤特殊字符 $content = str_replace(array(" ", " ", "", "&", "<", ">", """, " "), array("", "", "", "&", "<", ">", """, " "), $content); // 过滤脚本和标签 $content = preg_replace("/<script.*?>.*?</script>/si", "", $content); $content = preg_replace("/<style.*?>.*?</style>/si", "", $content); // 过滤URL $content = preg_replace("/<a.*?href="(.*?)".*?>/si", "", $content); // 过滤图片 $content = preg_replace("/<img.*?src="(.*?)".*?>/si", "", $content); // 过滤iframe $content = preg_replace("/<iframe.*?src="(.*?)".*?>/si", "", $content); // 过滤Flash $content = preg_replace("/<object.*?data="(.*?)".*?>/si", "", $content); // 过滤其他标签 $content = preg_replace("/<[^>]*>/si", "", $content); return $content; } ?>
这个函数dede_filter
接收一个内容字符串作为参数,然后按照以下步骤进行过滤:
1、使用strip_tags
函数移除HTML标签。
2、使用htmlspecialchars
函数防止XSS攻击。
3、替换特殊字符为相应的HTML实体。
4、使用正则表达式移除脚本和样式标签。
5、移除URL、图片、iframe和Flash标签。
这只是一个基本的过滤示例,根据实际需求,你可能需要添加或修改过滤规则,如果你需要保留某些标签,或者需要处理其他类型的内容,请根据需要进行调整。
最新评论
本站CDN与莫名CDN同款、亚太CDN、速度还不错,值得推荐。
感谢推荐我们公司产品、有什么活动会第一时间公布!
我在用这类站群服务器、还可以. 用很多年了。