视频|不要迷信算法,会变得无趣( 二 )


所以抖音的算法比其他短视频APP学得更快。这一点非常重要,要知道,即使算法本身同几年前并没有有太大差别,仅仅是在更大的数据集上进行训练,就足以让OpenAI开发出GPT-3这样的模型。
在抖音之前,绝大部分短视频App都采用了微博式的界面,照搬图文信息流的展示方式,以缩略图的形式显示视频,再加上几个关键词标签或一段描述。
这种信息展示的方式历史悠久,适用面很广,但是对算法来说并不友好。
至于抖音设计巧思的来源,如果你恰巧使用过他们早期的版本,就会发现其界面、内容、调性与Musical.ly如出一辙。
据说张一鸣很早就洽谈过收购musical.ly,后来未果才回国做了抖音。完成反向收购之后,字节的后端算法插入Musical.ly(现在的TikTok)的效果是显著的,用户时长很快就增长了一倍以上。
二、算法推荐是重要的,但它并非全部信息展现方式一直是互联网产品里最基础的部分,也是争议最大的部分。
只是在技术至上的论调下被忽略了。
最常见的信息展现方式有瀑布流,以及全屏。它们之间的区别在于一屏里放多少内容合适。
按照张小龙在微信公开课上的说法,一屏里的内容条数,跟命中率成反比。所以视频号上线后的前半年,采用半屏式的信息流展现方式。后来在灰度半屏和全屏的用户时,关注tab的用户因为内容命中率不够高,全屏后反而带来了后台清晰可见的选择困难。
这是内容池深度的问题,与推荐算法的调教无关。
这里普及一个技术方面的常识:当底层召回内容数据不足时,算法会从候选队列中进行降级召回。
即本来算法觉得用户可能会喜欢内容A,但整个内容候选集中都没有A的存在,只能递补与A相近的B。
如果连B都没有时,算法会进一步做降级召回处理,或是直接按照热度排序补充全局热门的内容给用户。
从而带来持续的恶性循环——被污染了的算法模型,会始终局限在某个范围内寻求帕累托次优解。
出于这样的理由,我更愿意相信视频号的全屏是出于内容积累到达某个临界点后开始进入调教算法的阶段,而非所谓的对抖音的妥协。包括快手的精选tab,也是同样的道理。
人们永远可以争论社交网络是由什么组成的,但需要明确的一个前提是,大多数社交网络都采用一种渐进的方式来扩大规模。
鼓励用户与其他人互关,一次建立一个联系。为工具而来,为关系而留,这样做唯一的问题就是速度太慢,而互联网恰好是一个崇拜速度的地方。
只需要搜几个关键词,无需关注或与任何人成为好友,抖音就可以快速了解一个人的喜好。
我们姑且把它命名为一个围绕兴趣建立的娱乐网络。现阶段,它是一个快速、高效的传播媒介,因为这个网络不由关系连接,所以抖音博主的流量永远不可能属于个体。
很多人认为抖音商业化走在前面是因为广告算法好,但实际上抖音对游戏广告主的包容程度才是隐藏不言的奥秘,他们允许以单个付费用户为单位结算,甚至可以约定“若用户流失则退款”。
然而想靠这个设计留住用户和增长并不现实(字节国内的广告收入趋于停滞已经证明了这件事)。中文互联网的残酷之处在于,任何UI设计都可以在一夜之间被同类产品模仿和复制,只要它被证明是有用的。
在这个机器学习占据主流的时代,全屏的设计就是为了帮助算法更快地去“看”这个世界。
但这并不意味着算法是万能的。因为直到今天,字节都没有办法大规模地侵入长视频领域,即使张一鸣的战略PPT上明明白白地写着“只要在信息分发领域,字节都要用算法来重新做一遍。”
即使抖音的UI设计让他们的算法迭代更快,也不可能做到筛选出人们行为信息中的所有“噪声”。有时,人们希望算法再“聪明”一些,更理解自己;有时,人们并不愿意重复看那些自己感兴趣的内容,也想了解一点公共热点;还有的时候,人们会想培养一些新的潜在兴趣。
事实上,那些乏味重复、引起用户轻微不快的内容才是产品的慢性杀手。如今,这些负面情绪正在抖音的APP里缓慢发酵。
算法今天不是,未来也不可能是万能的。
举一个最直观的例子,不管是我们自己的优爱腾,还是海外那个算法驱动的Netflix,内容消费都是以运营阵地和导航搜索为第一生产力的。
因为决疑成本的巨大差异,长视频至今还保持着传统货架式的消费方式:
最新最热的内容放在首页曝光度最高的轮播栏;用户依赖类目导航去查找想要的内容,比如按照类型、地区、上映时间和评分来选择电影;还有很大一部分消费来自于搜索对应的站外决策。