editplus正则表达式

March 23rd, 2008 humker No comments

原始:<span ****>
想要把他替换成空,在dz论坛转帖是遇到的问题。

editplus

查找:<SPAN.*>

替换:空

勾选正则表达式

Categories: 软件使用 Tags: ,

ecms和dedecms比较

March 22nd, 2008 humker No comments

ecms和dedecms,ecms对我来说先入为主,总是不想放弃。当然还有另外的原因,自己用dede4时,让人留了一个后门,ecms几乎没有听到过挂马之类的问题。dede5的板子非常漂亮,自己下午就用ecms放dede的,几乎是一模一样,就是评论处理出了问题,还有digg顶了以后要刷新才显示。两个模板制作都很容易,dede稍好一些。两个最大的差别也许是在编辑器,fck和htmlarea的比较。自己感觉dede更开放一些,想加些东西比较容易,论坛的支持ecms的要好一些。

自己会用dede做一些小站,不过要等到服务器恢复以后。dede有一个问题就是url标准化的问题,路径很多带有index.html权重没有目录高,而且列表页涉及到列表首页和list1的内容重复,seo是细节觉得一切,自己需要修改一些。dede5的兼容性还有一些问题,在一些版本的php中会出莫名奇妙的问题。

Categories: 网站建设 Tags: ,

web语言的发展预测

March 21st, 2008 humker No comments

一周前自己在joyo买了一本书,《php与mysql5程序设计》,花了60大洋,对学生来说比较心疼。看看php这东西是简单,在cms界php几乎是一统天下。随便的下载一个cms,上传上去,改改风格,ok一个网站出来了,可以称为垃圾站。现在,很少听说一个网站是单单的自己写内核,使用很长的周期去完善自己的代码,大部分是二次开发和一些功能的订制。软件正走向服务的方向。原来感觉php很有“钱途”的语言,现在感觉是错了。php只能自己用来做web开发,做做简单的前后台,大量的数据检索他是不能胜任的。

现在php很普及了,可以估计大量的php程序员会丢掉饭碗。java就不尽然了,什么都可以做,web的不用了,就做点erp什么的。当然c++就不用说了,肯定比较好混饭,也难学一些。现在我明白了小白当时为什么放弃xydw,看看phpcms现在的境地就知道了。

最后要补充一句,“语言很重要,选择要慎重。”这是对咱们这些“小家”来说,也就是拿这个东西当饭碗的。

Categories: 网站建设 Tags: ,

dede和ecms的采集过滤

March 20th, 2008 humker No comments

dedecms采集过滤

原创文章,转载请注明来源作者:
作者:yuxisan
引用通告:http://www.yuxisan.com/cmd.asp?act=tb&id=5&key=20298

dede采集过程中最麻烦的莫过于采集的正则过滤函数的编写。说实在的,dede在这点上和很多ASP CMS系统比如说动易等,采集的时候直接选择几个选项就可以了,简单的完成想过滤的东西。不过他们只局限于对文章内容的过滤不是很好。而DEDE却能对所有采集的字段进行过滤,功能上弥补了易用性的缺陷,期待柏拉图在后续版本中加上选择性过滤功能。
下面是在综合论坛上网友的各种正则的一个全集:

{dede:trim}
{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<img([^>]*)>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}<stong>{/dede:trim}
{dede:trim}</stong>{/dede:trim}

应用示例一:标题中空格的过滤
经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻烦,所以需要在过滤处添加下面正则过滤

{dede:trim} {/dede:trim}

应用示例二:来源作者中连接的过滤
在采集文章的时候,有的系统里面作者或者来源处都有连接,直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过滤

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}

应用示例三:文章内容中连接以及其他广告代码的过滤
这个就不用说了,当需要对所有东西过滤的时候,直接用上面所有的代码过滤就可以,但是实际应用中,我们只需要对连接、动画、调用等进行过滤。(这个需要按照对方内容里面具体含有什么代码来具体操作)
一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤:

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

应用示例四:过滤GG广告代码
其实这个就是在上面的内容过滤,但是很多论坛里的网友经常问这个,所以单独作为一个应用列出来:

{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

好了,上面四种应用基本上涵盖了采集的各种应用,掌握了这个,过滤基本上就不用求人了!

———————
一个帝国的万能采集过滤码(含正则)
可以防止采集后模反跑格,
防止内容内有别的网站的连接,
防止GG广告,防止潜入式页面,
防止表单,防止表格等等,

使用方法:直接复制后,放到采集的内容过滤框框内既可!

自已慢慢摸索吧!

——————————————————————————–

<a([^>]*)>,<A([^>]*)>,</a>,</A>,<DIV([^>]*)>,</DIV>,<div([^>]*)>,</div>,<DIV>,<div>,<script[!--ad--]</script>,<form[!--ad--]</form>,<iframe[!--ad--]</iframe>,<IFRAME[!--ad--]</IFRAME>,<OBJECT[!--ad--]</OBJECT>,<object[!--ad--]</object>,<table([^>]*)>,<table>,</table>,<tr([^>]*)>,<tr>,</tr>,<td([^>]*)>,<td>,</td>,<font([^>]*)>,<font>,</font>,<tbody>,<tbody([^>]*)>,</tbody>,<style[!--ad--]</style>,<span([^>]*)>,</span>,
————————————

 

Categories: 网站建设 Tags: ,

暴雪白皮书的读书笔记

March 19th, 2008 humker No comments

http://www.blizzardinternet.com/whitepapers/

一:
使用Linux服务器,利用url rewrite功能
二:
enable pinging
三:
利用slug
————–
开始blog
一:
当发布blog时,要仔细检查尽量避免死链,丢掉的图片,空的页面。SE随时可能来。
二:
页面,栏目,帖子
1,利用页面来放一些不经常更新的东西,不要频繁的更改
2,利用栏目,把你的帖子分为合理的主题,不要出现一篇帖子出现在两个栏目处

——————
使用关键词在title里
使用关键词时不要使用过于宽泛的,考虑一下人们的搜索习惯
————-
不要建立一些没有内容的页面,直到有直到添加的内容
—————–
不要从word中直接粘贴到wp中,要用记事本做一次复制,粘贴操作
—————
不要让同样的关键词出现五次在同一个帖子中,可以考虑使用同义词,围绕同一个中心,只提一点,说清楚
即可
—————————————-
导出连接
在你的帖子里,加入相关的连接,wiki,wp,作者的主页,要有合适的锚文字
no follow
使用blogroll,友情连接,PR值
—————————-
在相关文章间做连接,做好内链
————————
提高SE的相关度,写一篇充满单一主题关键词的帖子,练到原来的那个帖子
———————
使用选择性的摘要
选择性的摘要,要与内容的第一段(最好不要自动截取)不同。
栏目页会出现这部分东西
否则会出现复制内容的嫌疑
栏目页非常重要,同一主题内容
———————-
不要使用Archives索引,也包括月份索引,有复制内容的嫌疑。不要对se开放,可以用robot.txt限制
————————–
把你的blog登陆到SE或这开放目录
有些目录仅需要你的 RSS feed URL
—————————
多更新网站
—————-
宣传
添加到书签等的按钮
参加评论的讨论
利用Use Trackbacks,Feeds(推荐用feedburner)
—————
有用的东西,原创
——————–
wp SEO 插件
1,SEO Title Tag
页面标题权重高
2,Ultimate Tag Warrior
tag云
3,Add-Meta-Tags
meta-tag这个方法,对google没有用
4,Follow URL
wp评论的默认连接时nofollow属性
5,Contextual Related Posts
语义相关的文章,增加用户粘度
6,Social Bookmarking
书签,在siderbar
插件及时更新

另外月光有一篇不错

http://www.williamlong.info/archives/1050.html

 

Categories: 网站建设 Tags: ,