Archive

Posts Tagged ‘ecms’

dede和ecms的采集过滤

March 20th, 2008 No comments

dedecms采集过滤

原创文章,转载请注明来源作者:
作者:yuxisan
引用通告:http://www.yuxisan.com/cmd.asp?act=tb&id=5&key=20298

dede采集过程中最麻烦的莫过于采集的正则过滤函数的编写。说实在的,dede在这点上和很多ASP CMS系统比如说动易等,采集的时候直接选择几个选项就可以了,简单的完成想过滤的东西。不过他们只局限于对文章内容的过滤不是很好。而DEDE却能对所有采集的字段进行过滤,功能上弥补了易用性的缺陷,期待柏拉图在后续版本中加上选择性过滤功能。
下面是在综合论坛上网友的各种正则的一个全集:

{dede:trim}
{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<img([^>]*)>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}<stong>{/dede:trim}
{dede:trim}</stong>{/dede:trim}

应用示例一:标题中空格的过滤
经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻烦,所以需要在过滤处添加下面正则过滤

{dede:trim} {/dede:trim}

应用示例二:来源作者中连接的过滤
在采集文章的时候,有的系统里面作者或者来源处都有连接,直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过滤

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}

应用示例三:文章内容中连接以及其他广告代码的过滤
这个就不用说了,当需要对所有东西过滤的时候,直接用上面所有的代码过滤就可以,但是实际应用中,我们只需要对连接、动画、调用等进行过滤。(这个需要按照对方内容里面具体含有什么代码来具体操作)
一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤:

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

应用示例四:过滤GG广告代码
其实这个就是在上面的内容过滤,但是很多论坛里的网友经常问这个,所以单独作为一个应用列出来:

{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

好了,上面四种应用基本上涵盖了采集的各种应用,掌握了这个,过滤基本上就不用求人了!

———————
一个帝国的万能采集过滤码(含正则)
可以防止采集后模反跑格,
防止内容内有别的网站的连接,
防止GG广告,防止潜入式页面,
防止表单,防止表格等等,

使用方法:直接复制后,放到采集的内容过滤框框内既可!

自已慢慢摸索吧!

——————————————————————————–

<a([^>]*)>,<A([^>]*)>,</a>,</A>,<DIV([^>]*)>,</DIV>,<div([^>]*)>,</div>,<DIV>,<div>,<script[!--ad--]</script>,<form[!--ad--]</form>,<iframe[!--ad--]</iframe>,<IFRAME[!--ad--]</IFRAME>,<OBJECT[!--ad--]</OBJECT>,<object[!--ad--]</object>,<table([^>]*)>,<table>,</table>,<tr([^>]*)>,<tr>,</tr>,<td([^>]*)>,<td>,</td>,<font([^>]*)>,<font>,</font>,<tbody>,<tbody([^>]*)>,</tbody>,<style[!--ad--]</style>,<span([^>]*)>,</span>,
————————————

 

Categories: 网站建设 Tags: ,

ecms真正tag的实现

March 8th, 2008 No comments

ecms有自己的tag插件,是通过搜索标题字段来实现的,有诸多的不便,比如有搜索时间的限制等等。

真正的实现可以是搜索keyword,单做一个表,或者可以生成静态。

ecms不是开源的,不多考虑了。

Categories: 整站程序 Tags:

fck整合ecms的考虑

February 26th, 2008 No comments

 将ecms中的AddNews.php的

“//html编辑器”和“//强制签发权限”中的部分注释掉

就是用/**/括起来

找到</head>在他的上面加上

<!–fck–>
<script type="text/javascript" src="/e/admin/fckeditor/fckeditor.js"></script>
<script type="text/javascript">
window.onload = function()
{
var oFCKeditor = new FCKeditor( 'newstext' ) ;
oFCKeditor.BasePath = "/e/admin/fckeditor/" ;
oFCKeditor.ReplaceTextarea() ;
}
</script>
<!–/fck–>

这就ok了

还有就是将fck放到admin文件夹下,注意fck有自己的上传组件,我对他们还没有验证的控制,可以自己删除,随后我会处理。

本整合只是js整合

下载地址

FCKeditor 2.5.1 (Latest Stable)

ZIP File (source code included):
FCKeditor_2.5.1.zip
GZip File (source code included):
FCKeditor_2.5.1.tar.gz

 

下面的比较简单阿js整合

 http://docs.fckeditor.net/FCKeditor_2.x/Developers_Guide/Integration/JavaScript

1加载fck

<script type="text/javascript" src="fckeditor/fckeditor.js"></script>

2调用 

The TEXTAREA replacement method:

In <HEAD> add the "onload" method:

<script type="text/javascript"> window.onload = function() { var oFCKeditor = new FCKeditor( 'MyTextarea' ) ; oFCKeditor.BasePath = "/fckeditor/" ; oFCKeditor.ReplaceTextarea() ; } </script> 

In <BODY> add the below code to replace an existing TEXTAREA in the page:

<textarea id="MyTextarea" name="MyTextarea">This is <b>the</b> initial value.</textarea> 
今天试验了一下php整合,改了一点代码成功了。
工具栏添加,找到一篇好文章。
http://www.javaeye.com/topic/150487
Categories: 整站程序 Tags: ,

ecms整合tinyMCE

February 23rd, 2008 No comments

在e/data/html/1.php中的合适位置加上下面这段代码 

<!– tinyMCE –>

<script language="javascript" type="text/javascript" src="/e/data/tiny_mce/tiny_mce.js"></script>

<script language="javascript" type="text/javascript">

tinyMCE.init({

mode : "exact",

theme : "advanced",

elements : "newstext"

});

</script>

<!– /tinyMCE –>

http://prdownloads.sourceforge.net/tinymce/tinymce_3_0_1.zip?download的东西中的tiny_mce放在e/data下

重命名/admin/editor文件名或删除

tinyMCE使用/集成/设置/详解

http://www.cublog.cn/u/16928/showart.php?id=255585
剩下自己看看效果吧

编辑器中没有涉及到上传文件的考虑,主要是安全问题,以后慢慢考虑

先做个记号,下面是比较完整的,看看fckeditor

<!– tinyMCE –>

<script language="javascript" type="text/javascript" src="/e/admin/tiny_mce/tiny_mce.js"></script>

<script language="javascript" type="text/javascript">

tinyMCE.init({

mode : "exact",

theme : "advanced",

elements : "newstext" ,

plugins : "advimage,advlink,emotions,iespell,insertdatetime,preview,media,visualchars,xhtmlxtras,style,pagebreak,filemanager",
                theme_advanced_buttons1 : "bold,italic,underline,|,justifyleft,justifycenter,justifyright,justifyfull,|,bullist,numlist,|,insertdate,inserttime,|,forecolor,backcolor,|,hr,removeformat,formatselect",
                theme_advanced_buttons2 : "link,unlink,image,media,|,undo,redo,cleanup,|,code,preview,styleprops,pagebreak,filemanager",
                theme_advanced_buttons3 : "",
    theme_advanced_toolbar_location : "top",
                theme_advanced_toolbar_align : "left",
                theme_advanced_path_location : "bottom",
                extended_valid_elements : "a[name|href|target|title|onclick],img[class|src|border=0|alt|title|hspace|vspace|width|height|align|onmouseover|onmouseout|name],hr[class|width|size|noshade],font[face|size|color|style],span[class|align|style]"
               

});

</script>

<!– /tinyMCE –>

Categories: 整站程序 Tags: ,

ecms seo的思考

December 29th, 2007 No comments

自己用了一年多的ecms,从4.0到4.6,功能可能是最好的,而且也是最稳定和安全的。

就是有一点,它不开源,而且每个页面都有一个类似于

这样的尾巴。

这个尾巴按照搜索引擎的协议,他们是忽略这个注释的。

google确实是这样,而baidu就自私一些,这是标记一个网站的很好手段,有这个标记的就降权。

只是我自己的体验,不代表一般现象。

而且现在的4.7,只有首页和栏目封面有这个尾巴了,情况会好许多。

Categories: 网站建设 Tags: ,