以小见大:从库,搜索与索引预见互联网未来(下)

资源管理革命的未来:

我个人认为,要做搜索,要做网络商务(生意也只是赚信息不对称的钱),一定要看看那两个文档,如果现在没看懂也没关系,至少有可能会觉悟得更早。正如近年兴起做网站还要研究SEO的道理是一样的道理。

无觅网的搜索是云端的,而我的文档里面第一次提起云计算是今年的3月份。大家不用以为这有多神,先简单地理解为所有的主机放到一个地方吧。这样,所有的信息都是集中的。这样做的好处是外包了累赘的东西,发展人类的核心竞争力!正如IBM把硬件的生产卖给联想,专做数据处理和系统开发的生意。

把组装主机外包了,如果有100个人要装电脑却又不必需要有10个会装电脑的人,只要一个了,叫做云主机的,整个社会就节省了要学会电脑的成本。发展了的核心竞争力并不是大家的,而是20%知道科技真相的人,而竞争对手不是某个人,而是环境,提高的是人类把这个世界改造成更适应我们的能力。

但你不要以为一切与你无关,因为技术的力量的结果是让这个社会更加两极化。假如出生在云时代的人,却又没经历过这个变幻的过程,云主机就像不存在,而表象离真相又远了一步的。科技的结果是懒的人可以更懒,笨的人越笨,聪明的人越聪明,富的人越富,穷的人越穷。因为他们给真相的本源加上无数的衣壳。最后简单到让你过得很舒服,却生活得很困难。当然,这也是一种合理的进化论。

看到这里,你会不会很懂得为什么21世纪是信息时代,而最大的竞争是科技和人才?? 不能否认善用互联网的人都是比较前瞻的,互联网能提高了对信息的获取能力,锻炼了人的再整合能力,强者更可控制信息,成为判断的标准。

常用google 产品,还以为微软歇菜了,看了两个文档后才知道,微软只是是抓住了自己的优势在慢慢布储。记得文档里面有一段话,“微软把诸多功能从 Windows 本身剥离,而放到 Live 中去,究竟是为什么呢?为了应付反垄断?还是为了提升 Live 的地位?可是搜索品牌又被微软改成了“Bing”,这还真是奇妙。但是从 Windows Live 的整体战略来看就可以体现出什么叫战略思想,从即时通讯到邮件、博客、库管理、资源同步、娱乐、链接系统 ID、下面即将说到的Office Live、甚至连申请Windows测试版的 CD-KEY 都是用Live ID„„反思其它联机ID提供商,有谁能提供如此广泛、丰富且又一致的服务?如果要比较,可能只有 Google够资格。”微软有巨额的windows live 用户群,无销烟的斗争,鹿死谁手根本还没有定论。有定论的是,未来云网的大鳄是Google和微软的。

云计算真的不远了!这世界总不会等到所有人都有了电脑才开始研究云,连中国都有先富带动后富的道理,正如别人要进步不会先等你同步的!

反醒我们的腾讯吧!中国数一数二的IT公司,即然未来搜索和索引是最近数据本源的办法,在他所有所有的产品里,不但看不到类似的创新,还吝啬开放UI接口。我个人的确是不喜欢腾讯的,当然我也是知道360度的品行和事情的缘由,不喜欢的原因与抄袭无关,与厚不厚道有关,古语有云,凡事留一线,日后好相见。凭着腾讯巨大的用户群,如果能先引领用户使用前沿技术,开发他们的需求,再推出相关产品时,中国大半个互联网都可以都是企鹅的。


把你的想像力放到互联网

如果你能看到这里,无比的感动和惊喜!前面说了那么多,都是预见,我说过产生不了实际价值的精神是毒药。如果我们看得比别人远了,我们就会比别人进化得快一步。

先问一个问题,假如你要了解一块希捷250G的硬盘,你会怎么做?中关村?太平洋电脑网?事实都不是了,我们依旧会先打开google或百度,输入“希捷250G”,假如第一条信息是泡泡网的,那么我们就很有可能从泡泡网知道这个信息了。

难不成你会记住它们的网址?然后等进到这些网站后再搜索寻找有关“希捷250G”。如果不用记网址,但从凌乱的收藏夹找出来,然后还把范围变小了地重新搜索,速度难道会快点么?

人们的已经慢慢地改成用搜索索引代替以前的做法。走到某块关于卖电脑的地儿,然后再在那块地儿上搜索关于“希捷250G”的做法已经给淘汰了!

如果有建过站,某网站也只不过某个系统下的某硬盘中的某应用程序,你应该能理解我以下的假设:

网址相当于“文件路径”,所以网址是网站资源的一个属性;

因为人们已经习惯用上了搜索,网民已经不会再记住网址了。(说明什么,说明域名会不断地贬值,特别是当IPV6盛行起来时)

又因为资源管理的革命,搜索时,资源被抓取的依据是索引(也可叫属性或标签)。

所以网站一定要有标签!一个资源(即一个网站)本身需要包含了很多信息,如中关村网站,会有手机,笔记本,照相机。所以每一份数据都需要tag去代表他的身份。

从另一个角度,我看到的是,网站已经不需要专门化了!不管是专业或不专业的信息,只要是有相同的tag,都会给google抓取到一起,根据pr和网站排名,输出给你看!你所要做的只是选择和判断。

现在的搜索是全文检索与索引检索并存的,但随着资源管理的革命,索引检索会越发重, 而对于一个网站来说,你的主题是什么也许也已不重要了,你不必再想,你博客一定要专门化,写关于什么的,关键是,你所写的关于什么的有没好设好标签给搜索引擎找得到你的索引。

试想一下,随着互联网的社会化和媒体化,网民大都花时间在玩游戏,看电影,上校内,对于一些资讯分享类的网站来说,已经越来越少的人会专门从收藏夹打开来看上半个小时。即使是对资讯类网站的某内容感兴趣也会通过RSS定阅分类目录而得知,毕竟如果我只想了解手机资讯的话,我没有必要连电脑,数码相机的资讯也要扫一遍。所以,关键是要迎合搜索引擎。

正如我前面所说过,网址是一个tag,所以显示以标题内容的信息更易给搜索的,这就是为什么网站的固定链接会和seo有关。

另一个引发出来的问题是,资源要规范,这个类似于正确地使用word, 打在标题的属性的地方不能写的是内容。再者就是在做wp模板或编程一个网站时,结构要清楚,类和功能的定义要有逻辑。

如果你是一个博客的站长,不要再为主题什么的纠结了。你完全不需要担心你分享的东西是什么,看你博客的人喜不喜欢,尽管地去分享你想去分享的东西吧。关键是该被抓取时会不会给抓取。


关于web3.0

原来个体的信息处理能力和获取能力都是有限的,但是现在通过互联网上,通过无处不在的网络和终端,每个个体都可以成为一个“神经元”,进而构成一个拥有最高信息处理和获取能力的“群体智慧”。这已经在改变整个人类社会的大格局,因为其从本质上颠覆了原本企业、甚至政府对于公众的信息优势。所以一系列传播、营销、服务的方式都将随之变革。 《凯文·凯利: 创新是怎么来的》

这一切的发展都有点像《世界是平的》里面所写:web3.0时代,推动力则来自个人。个人与群体之所以能够如此轻易完成地加入全球竞逐,利器不是马力,不是硬体,而是软体,是各式各样的电脑程式,加上全球光织网路的问世,是天涯若比邻。

看的博客多了后,便会发现大家懂的东西都很多,于是一个网站的主题更不会给固定。因为这个世界是联系的,从知识层面上去说,先进化的人,需要博学些才能联系起来看到信息的原始形态,减少信息的不对称。未来,有才的人会越来越多,因为信息的透明化,他们的专长会有很多项。当一个物种从环境竞争,群落竞争,种族竞争发展到个体竞争时,那么离灭亡也不远了,或者可以说成要进化成一种新的物种。物竞天择,适者生存,从来都是真理,不是么?


给无觅网的建议

如果一个网站已经不需要固定主题了,寻找链接时又如何保持准确性,能不能根据选定的分类目录而去显示相关文章?

还有链接同步的方性性,其实不一定要是双向的,就向博客链接一样,也能是单链的吧,只要愿意,当然应在平衡了一些弊端后。

即然是通过搜索标签而抓取相关文章的,如果能整合上定义资源标签的功能会不会更好呢?当然也避免了一些博主在发表博文时忘记了写上标签。

关于我博客的应用

从来没有想过我博客的标题和副标题能取得那么贴切“杜小白之家”and “What you see is what need to be doubted.”从来不敢确定我的主题是什么,因为这里什么都有。这是一个人分享博客。

我也打算博客大改版了,分类目录精细些,而且要支持RSS分类输出。那么如果对博客里的某类感兴趣的话,只要订阅分类就行了。把3D标签球上的内容改为分类目录的链接,给一些文章增加标签,最后然后换上静态的彩色标签。

对于分类目录,决定要再增加一个美容护肤频道,说不定哪天我还再开个情感对话,哈哈哈哈。。。。


后记:

这个博文和后续的一些思考,我想应当写成一个论文的。当然,我在想着,等我把一切都理顺些后,找本杂志投稿才能更有影响力吧。


关于库的更多资料:

库、搜索和索引,很多人对其有严重误解

库,不只是库而已

思想重于技巧,内涵重于表象 =   这个就这样吧

日常生活中会碰到的一些”库”的应用

加入对话

13条评论

  1. @dudo
    没有收无觅的钱,但我有用无觅啊。看了柳亚的:无觅从“搜索”到“发现”后,才发现我对无觅的推荐搜索理解是有偏差的。

  2. 昨天在功能升级过程中发现搜狗的网站评级系统升级了,由原来100分制变成10分制,而且增加了专用查询服务器,查询链接格式为http://rank.ie.sogou.com/sogourank.php?ur=http://www.wsprite.com/,特来提醒朋友,快试试自己的博客和朋友的博客是属于哪个级别。

留下评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据