首先,来说一下做站为什么要讲心态,冰冻三尺,非一日之寒。凡事都有其规律和过程,急不得。最可惜的是在胜利的前夜撤退。这些撤退的人往往是没有意识到事物的正常规律,错误判断了形势。比如短期获利和长期发展的取舍,就是一个大家经常会遇到的问题。什么叫短期获利,比如放弹窗,帮人挂马……这些短时间都挺赚钱,又或者是在论坛过度做广告,短期内流量也会上来很多。但是过后呢?经常是一个站就这样废掉了。
许多人忙忙碌碌好几年,发现自己没有做成一个站。而一些比自己做站晚的,所谓很笨的站长,反而成功了,就是心态的差别。但是另一个极端就是过于求大。好多人做站,上来就弄服务器,甚至请专职技术、专职美工来帮忙。但我觉得除非本身就财大气粗,刚开始做站是不宜投资过大的。初期除了域名其他都可以免费或低价凑合。前几天在参加应老K邀请参与的5.16高端站长聚会上认识的小邪,他的小说站每天pv2000万。但他刚做站时,就是很多空间拼起来用的。顺便讲讲什么是做站的核心资源。域名和数据是核心资源,千万不能丢。但是域名不一定用太好的,站好比域名好值钱。不宜盲目追求过于贵的域名。
一个好的域名可以带来很大的天然流量,也方便网友记忆,甚至是企业品牌和实力的象征。但在265的同事中,也有和老蔡持不同意见的人。他们认为许多网民根本不记忆域名,往往是用收藏夹来存网站的。我现在的想法是,在中国做站,域名不能太难记,如果用一长串英文或者无意义的字母,不利于推广。但是要认识到相当多的网民喜欢用收藏夹。因此,不管自己域名好不好,都要大力鼓励用户收藏自己的网站。普通的站,你即使用技术手段让用户设为主页,用户也会改掉。但是,你让他收藏,如果他觉得你的站确有特色,是不会反感的。
我05年开始做站的,当时已经没什么好域名可注册了。域名大佬们说2000年前好米就被注册光了。我当时就注册了几个比较长的拼音域名,有十几个字母吧。有人就说你的域名太长了,不好。但是后来无意中发现,拼音域名在和你域名同音的关键词上权重特别高。这其实是百度和谷歌在中文搜索方面的技术竞争造成的,对网民是好事,对站长更是好事。因为如果你注册不到,或者买不起特别短的域名,你可以注册个拼音域名,一样好用,好记。这是中国特色,老外不懂拼音,我们还有机会选到好的域名。
说完域名,我们谈谈数据的重要性。数据一定要定期备份,不然发展越快,损失越大。这是我的教训,大家一定要记住。我最早的网站是放在一个朋友的空间里。我朋友在电信局,我认为电信的服务器肯定不会出错。所以没有经常备份。后来有一次,我突然发现网站打不开了。然后上ftp一会能上,一会儿不能上。我没在意,以为是网络故障第二天,我那朋友告诉我,我用的空间所在的服务器硬盘坏了。当时万幸的是我比较大的一个站已经放在自己托管的服务器上了,损失的主要是个人主页和博客的数据。后来,我花了几个晚上通过百度快照等,才把博客内容恢复了。大家在选择空间时,也要问清楚空间商提不提供定期备份,如果没有,就自己定期手工备份。
数据说完了,我们说说采集还是人肉的选择。人肉就是人肉更新,即手工更新。经常有站长说自己采集了几百万条数据,收录增加了多少,钱赚了多少。我们也经常会看到什么自动采集,自动设关键字,自动更新的软件广告。那些采集软件也就几百块,每个人咬咬牙就能买一套。但是采集是万能的吗?如果大家都采集了,互联网上就是不断循环的有限重复内容了。我曾经在几家门户网站做过编辑。最初,是大家争着上采集系统,以增大新闻量,减轻编辑的劳动压力。但是,我了解到,多家门户一度使用非常先进的采集系统,现在回过头抛弃了采集,开始让编辑手发。为什么?因为搜索引擎已经能识破大多数机器采集的特征,无论谷歌还是百度都喜欢原创的,去重,是百度的核心规则。
我有个朋友搞过搜索引擎相关的技术,他告诉我,搜索引擎是会判断文章的原创“指纹”的。比如老k原创了一篇博客,我采集过来,替换了一些关键字。百度和谷歌还是能认出来我是抄老k的,为什么?因为指纹没有变。而且,人肉(手工更新)还有一个好处,就是内容质量的把握。机器采集的话,符合规则的都抓过来,人工更新,对于文章优劣是有基本的判断的。大家在上网时,对于哪个站是采集的还是人肉的,相信很多时间自己就能感觉出来。另外,在中国做站,有一些地方特色,比如哪些内容不能发。这些敏感内容仅靠关键词过滤是不够的,不如人工更新来得安全。比如一张图片是否低俗,是否露点,机器识别不出来。有这类的软件,但识别率不高,无法应用于采集。即使是要采集,建议大家先采集入库,再人工审核。这样兼顾了效率与质量。