本文作者为Sangeet Paul Choudary,原文标题:How Sampling Costs Kill Social Curation. Social Curation是社交圈的一个新兴行业术语,有人翻译为社交策展或社交聚合。 Curation的含义类似于艺术策展人的Art Curator。
对基于用户原创的平台或应用,社交聚合是一个很好的衡量工具。最有名的要数 YouTube 和 Quora,它们允许社区中的用户对内容投赞成票、反对票以及举报垃圾,从而创造平台价值。 一般来说,这种基于用户原创内容的创业项目在对公众开放之际,会看见喜闻乐见的扩张。
说起来很轻松,但真正实施起来难度也不小,光是清理用户内容中的垃圾就够头疼的了。(更多详见作者的另一篇文章 反向网络效应 Reverse Network Effects)
这篇文章将从平台的角度,讨论了在什么情况下社交内容策展/聚合有效?
什么是采样?
采样的概念是最初来源于传统零售业。决定新产品是否在零售商店引入,商家通常会先免费分发样品;只有当采样的用户反馈比较好时,零售商店才会引入。这个概念可以被应用于每个和用户相关的决定。 采样可以让用户:
a) 就质量做决定:采样不仅可以帮助用户提升消费经验,也有助于他们把这个信号传达给其他的用户;
b) 向生产者提供反馈:如果零售商卖不出存货,那么商家是时候反思自己的产品了。
社交聚合系统和采样
社交聚合平台应用了类似于采样的思路 - 捕捉并分析用户的行为。但是,社交聚合做的比传统采样更多,它们能整合所有的输入,创造出:
1) 供新用户做决定的基础:像 Quora 那样,赞成票数可以帮助潜在用户决定先读哪条回答;
2) 供排名算法使用的质量得分:在 YouTube 上,一条视频的得票多少决定了其在搜索中的出现位置;
3) 供原创用户使用的反馈环:创造者从他们的创造中接收反馈,比如 500px 网站,和 Dribble 站点。
一个社交聚合平台本质上是所有采样决定的权重之和。
为什么有些社交聚合系统失败了? - 采样开销
每个采样决定都有必要的开销,通过采集一个随机分类的方法找到特定用户群是很费时间的,这个过程随着开销的增加变得更加低效。举个例子,通过旁听二十门课来决定上哪一门课程,是件非常低效的事,这就是为什么教育型的网站无法采用 YouTube 这样的聚合思路。当采样开销非常高时,编辑式的谨慎筛选 - 何种信息放在网上,何种信息被过滤掉 - 就更有实用价值。
在某些情况下,采样成本高到完全行不通。比如说医疗健康类决定,就有极高的开销,选择错误的医生可能小命都不保了。在这种时候,专家或编辑的意见就应该成为聚合系统的首要考虑因素。
社交聚合平台的优势在于,量化降低了单纯采用编辑的意见产生的偏见。某种形式的内容或服务采样开销越大,越多的时间就会被花在达到这个高标准上,这就是为什么采样花费越大的社交越低效。
上述讨论可归结为以下两点:
1) 认清社交平台上最基本的构成元素。YouTube 的基础单元就是一条视频;Quora 的基础元素就是一个答案;Udemy 上的基础单元就是一门课程;
2) 决定开销 — 时间、金钱、风险等方面而言,衡量每个内容单元的平均开销。
采样开销越高,一个社交聚合平台的表现就越差。
内容之外 - 服务
基于服务的应用平台,比如oDesk,Fiverr,Airbnb以及TaskRabbit,依赖于社交聚合。两个因素决定了这些平台的社交聚合有效性:
1) 平台保持交易的能力
2) 服务周期
[Ok3w_NextPage]当一个平台可以协调用户交换服务,它在鼓励用户原创上就更可能成功。Elance和Clarity需要用户在网络平台上的交易;而 Airbnb 和 TaskRabbit 则需要用户线下交换服务。
当真实的交换服务发生时,消费者和生产者,会被要求评价另外一方。交换服务发生在线下时,服务周期就替代了用户样本。服务周期越长,一个平台就越难召回用户或者让用户评价另一方。在服务周期很长的情况下,大部分平台会依赖激励机制,鼓励用户聚合。
采样的偏见
花费不是采样的唯一缺点;某些采样决定存在固有的偏见。为了有助理解,试分析一个大家曾经见过的互联网创业模式。在 90 年代,曾经有一些公司付费给用户去看广告,这些公司并不需要花太大力气就能吸引用户来做这件事,但广告商很快意识到这个模型的严重缺陷。为了挣钱去看广告的用户,通常是那些没有钱去购买相关产品的人,也就是说,给他们看广告根本没有任何实际意义。
这对采样分析来说也是一样的。如果采样花费过高,比如说特别耗时,那么吸引到的就是那些有多余时间的用户,而这些用户又往往不是理想的受众。
故意使用偏见 - 过滤内容
然而,某些平台反其道而行之,利用偏见的特性。比如说,Agoda只允许曾经预订过宾馆的用户来评价某些旅店,这就阻止了用户输入虚假信息。而虚假信息在TripAdvisor上就时常出现。在 Agoda 的案例中,平台是被故意被设计成这样的,特地防止用户输入垃圾信息。
采样 - 主观?文化背景?
社交聚合不会自己发生。任何有明确目标的用户系统,都需要预先设定某些社区文化背景来鼓励或是阻止用户创作。当采样决定是主观时,这一点尤其重要。比如说,Quora 上的反对票就非常主观。为了避免过度的反对或赞成票,用户需要被提示乱投赞成票或反对票的后果。不消说,没有用户会去真正读一堆社区条例的,因而就需要营造一种鼓励或者抑制原创/互动的社区文化。这个文化不是由规则、而是由一个社区营造的。
当用户采样过于主观或模糊时,需要通过建立社区文化来解决问题。
社交可能只在量化时有效,需人为启动平台运作
这也许多社交聚合系统的问题,也是为什么许多创业公司最好以编辑式的聚合以及逐渐对外开放社区的方式来营销。 Quora 和维基百科就通过这个方式成功地实现了扩张。在它们的早期阶段,Quora 的编辑和管理员承担了绝大部分的内容创作和审核工作。随着社区的逐渐壮大,用户不断输入新的内容,编辑们就逐渐退居二线。当然啦,在这些情况中,想办法给好的贡献者建立良好的名声,有助于过滤去坏的评价。
在教育平台的例子中,编辑的判断对量化也会有影响;而对娱乐内容来说,社交聚合的重要行就更明显了,可以过滤掉更多的噪声。
能扩张并能充分利用社区的系统,通常都是从人为创作开始。
再次声明,社交聚合不适用于所有平台
新兴的创业公司总是试图拷贝成功案例的功能,但问题是,大家往往抓不住精髓,只能取个形似。一些创业平台企图给自己的系统也加入投票功能,但却不明白,投票系统并不适用于所有的在线平台,正确了解你的系统和用户,合理采用分析,才有可能成功。
总结:
1) 了解你的平台系统,搞清最基本的单元是什么,分析用户采样的开销;
2) 平台/应用推出初期,以编辑创作审核内容为主;
3) 基于用户采样,在维护编辑监管的同时,逐步扩大网站规模,不要想一口吃个胖子;
4) 当分析出采样的成本过高时,分解用户聚合的过程,只采样一小部分做分析。