Blogging与大众智慧
Web 2.0时代被高度吹捧的一个特点是blogging的兴起。个人主页在互联网初期就开始活跃,个人日记和每日评论专栏比这个时间还要长,那么这一切有什么值得大惊小怪的呢?
最基本的,blog只是日记形式的个人主页。但是正如Rich Skrenta指出的,blog按时间顺序的组织形式“看上去好像是微不足道的差异,但它推动了一个完全不同的传输、广告和价值链。
造成这些区别的其中之一就是被称为RSS的技术。RSS是自早期黑客认识到CGI可以被用来创造数据库支持的网站以来,互联网基础体系中最有意义的进步。RSS允许人们不仅是链接到一个页面,而是订阅它,当每次有页面更改时,都会有通知。Rich Skrenta称之为“增加的(incremental)互联网”,其他人则称之为live web(活的互联网)。
当然,现在“动态网站”(也就是数据库支持的网站,有动态产生的内容)在过去10年里代替了静态网页。Live web所说的动态不仅仅是页面,而是链接。指向一个weblog的链接可能指向一个不停在变化的页面,每一篇单独的条目则有一个永久链接(permalinks),每个更改都有通知。就这样,RSS feed是比书签或单独页面链接要强大的多的链接。
RSS也意味着浏览器不再是浏览网页的唯一工具。一些RSS聚合器,例如bloglines是基于网络的,其他是桌面客户端,还有一些则允许用户通过便携式设备订阅不断更新的内容。
RSS现在不仅被用来发布blog新条目通知,也被用做各种数据更新,包括股票报价、天气数据和相片的有效性。这种应用实际上是RSS本源的一种回归:RSS诞生于1997年,来自Dave Winer提出的Really Simple Syndication技术,一般用来推送blog更新。网景公司的”Rich Site Summary则允许用户用不断更新的数据流创建自定义的Netscape主页。
Netscape后来失去兴趣,这种技术由blog先驱Winer 的公司Userland继续发展。在目前的应用程序中,我们看到,尽管这是父母双方的遗产。
但是,RSS只是blog区别于普通网页的特点之一。Tom Coates有关于permalink意义的陈述。看起来,它不过是微不足道的功能,但却是使得blog从一个易于出版现象转变为重叠群落的对话混乱(a conversational mess of overlapping communities)。它使得直接表示他人网站上非常明确的帖子第一次变得相对地容易,以及讨论。讨论形成、聊天形成了。结果,友谊形成或变得更加确立。Permalink是第一次,也是最成功的在blog之间搭建桥梁的尝试。
在许多方面,RSS和permalink的联合给NNTP增加了许多特性,在HTTP网络协议上。Blog圈可以被理解为早期互联网某些事物新的、对等的等价物,例如Usenet、BBS和会话水坑(conversational watering holes)等。人们不仅可以订阅彼此的网站、轻易在一个页面链接个人评论,同时通过trackbacks机制,当其他人链接到此页面时,他们可以看到并进行回应,不管是通过相互链接还是增加评论。
有趣的是,双向链接是早期超文本系统的目标,例如Xanadu。超文本纯化论者(purists)庆祝trackback,认为这是通往双向链接的一步。但是注意,trackback不是完全的双向,他们实际上(潜在的)是对称的单向链接,创造了双向链接的效果。这其中的区别看起来似乎很小,但在实践中却很大。社会性网络系统――例如Friendster, Orkut和 LinkedIn,他们要求得到接受者的承认以建立链接――他们和互联网都缺乏相同的规模可伸缩性。正如flickr合创者Caterina Fake指出的,注意力只是巧合的相互作用。(flickr就这样允许用户设立监视表――任何用户都可以通过RSS订阅其他用户的照片。注意力的目的是得到通知,但不必链接)
如果web 2.0的核心之一是利用集体智慧、将互联网变成某种意义上的全球大脑,那么blog圈就是前脑中不断呓语的等价物,我们在大脑中听到的声音。它可能不反映大脑深层次经常的无意识的结构,但却是有意识思想的等价物。作为有意识思想和注意力的反映,blog圈开始拥有强大的影响。
首先,因为搜索引擎利用链接结构,以帮助预测有用的页面。和大多数多产、及时的linker相似,blogger在修正搜索引擎结果方面有不对称的角色。第二,因为blog社区太过依赖参考自己,blogger关注夸大可见度和能力的其他人。批评家谴责的回响室(echo chamber)也是一个放大器(amplifier )。
如果这仅仅是放大器,Blog将变得无趣。但就像维基百科,blog也利用集体智慧作为某种过滤器。James Suriowecki 所说的“大众智慧”开始产生效果了。PageRank产生的结果比其他任何个人文档分析都要好,blog圈的集体关注决定价值取向。
主流媒体可能认为个人blog是竞争者,其实真正让他们失去勇气的是:他们的竞争对手是整个blog圈。这不仅仅是网站之间的竞争,而是商业模式之间的竞争。Web 2.0世界也是Dan Gillmor /所称的“自媒体(we, the media)”。在这里,此前的听众决定什么才是重要的,而不是后台的少数人。
数据是下一个Intel Inside ,每一个重要的互联网应用程序,到目前为止,都由专门的数据库支持。Google的网络爬虫,Yahoo!的目录(和网络爬虫).Amazon的产品数据库,eBay的产品和商家数据库,MapQuest的地图数据库,Napster的歌曲库。正如Hal Varian去年在一次个人谈话中谈及的,sql是新的html。数据库管理是web 2.0公司的核心能力,到这样的程度以至我们有时候用”infoware提到这些公司,而不是software(软件)。
这个事实引发了一个关键问题:谁拥有数据?
在互联网时代,人们可以发现许多例子,控制数据库从而控制市场并获得巨额利润。Network Solutions公司(后来卖给Verisign),最初由政府批准他们在域名注册上的垄断,成为互联网最早挣大钱的公司之一。我们已经讨论通过控制软件API的商业优势,这在因特网时代更加重要,控制数据源则不是,尤其是如果那些数据源创造起来非常昂贵或有责任通过网络影响增加回报。
看看MapQuest, maps.yahoo.com, maps.msn.com,或者maps.google.com,等地图网站每张地图底部的版权通知,你会看到这么一行:“地图版权归NavTeq, TeleAtlas”或者是新的卫星图片服务商,“图片版权归Digital Globe”。这些公司在数据库商进行了大量投资(据报道,仅NavTeq公司就投资7500万美元建立简历街道地址和方向数据库。Digital Globe花费了5亿美元发射自己的卫星,以改进政府提供的卫星图片。)NavTeq甚至于模仿英特尔的intel inside 的logo:装有导航系统的汽车,留下”NavTeq Onboard的烙印。数据的确是这些应用程序的Intel Inside,是那些软件基本来自开源代码或经过改良的系统的唯一来源。
目前地图市场激烈的竞争证明,失败者如何理解拥有应用程序核心数据重要性程度,最终减低其竞争地位。MapQuest从1995年开始地图服务,是此行业的先驱。而当yahoo和微软google决定进入此行业时,他们只需要获得相同数据的许可,就可以提供具有竞争性的服务。
但是,与此相反的是amazon的地位。和Barnesandnoble.com等竞争者类似,它最初的数据库来自ISBN注册提供商R.R. Bowker。但与MapQuest不同的是,amazon增加了数据,增加了诸如封面图片、目录、索引和样品材料等出版商提供的数据。更重要的,他们利用用户注释这些数据。10年后,amazon,而不是Bowker ,成为书籍目录资料的主要来源,也是许多读者、学者和图书管理员的参考资源。Amazon還引入了他们自己与ISBN相对应的产权标志-ASIN。Amazon就这样有效地包含和扩展了他们的数据提供商。
设想一下,如果mapquest做了同样的事情,让用户注解地图和方向,增加价值。只通过颁发基础数据许可,就会让竞争者进入这一市场更加困难。
Google maps为应用程序卖家和数据提供商进行竞争提供了一个鲜活的实验室。Google的计划模式导致许多增值服务的产生,以组合形式出现,用其他可接入因特网的数据源链接google地图。Paul Rademacher的housingmaps.com,就把google地图和Craigslist公寓出租、家庭购买数据联合了起来,创造了一个互动的住宅搜索工具,这是类似mashup(译注:似乎可解释为组合)的优秀例证。
目前,这些mashup大多数是创新的试验,由黑客们完成。但是,企业家的活动紧跟其后。人们发现,google至少已经为一个种类的开发者占据了数据源的地位,并把他们自身作为受欢迎的中介插入。随着数据提供商和应用程序卖主都认识到,某些种类的数据将变成web 2.0应用程序的基础,我们将在接下来几年内看到他们发生战斗。
竞赛在我们自己某些类型的核心数据:位置、身份、公共事物日历,产品标志符和自己的命名空间。很多花费巨资创造数据的案例中,可能有机会使得Intel Inside模式运转,在数据只有一个来源的情况下。在其他方面,第一家通过用户聚合、到达临界容量的公司将是获胜者,并将聚合的数据转为系统服务。
例如,在身份领域,PayPal, Amazon’的1-click以及其他数百万用户的交流系统,都将是建立网络范围身份数据库合法的竞争者。(在这点上,Google最近尝试用手机号码作为Gmail身份标志符可能是其踏入电话系统的一步。)同时,Sxip等公司正在探索联邦身份的潜在可能,试图找到某种可以提供无缝的web 2.0身份子系统的分布式1-click。在日历领域,EVDB通过wiki式的参与机构,尝试建立世界最大的共享日历。
在关于数据方面,必须指出另外一点,这就是用户关心的隐私和数据权利问题。在很多早期网络应用程序中,版权很宽松。例如,Amazon认为(但没有强迫),任何提交给站点的评论,人们可以在其他地方再次张贴相同的内容。然而,随着公司开始认识到控制数据可能是他们竞争优势的主要来源时,尝试控制将有所增加。
和专有软件(proprietary software)的增加导致自由软件运动类似,我们希望专有数据库也能在接下来10年内引发一场自由数据运动。我们已经可以在诸如维基百科、Creative Commons等开源数据项目以及Greasemonkey等软件项目中,发现了这一趋势的早期征兆.