许多产品团队从未听说过系统可用性量表(System Usability Scale,简称SUS),所以当第一次拿到调查结果、看到71分时,会想”……这算好吗?“——这完全可以理解。
简短的回答是:高于平均水平,但还不至于让用户主动向别人推荐你的产品。
以下是你的分数真正意味着什么——以及如何利用它来改进你的设计策略。
什么是系统可用性量表
系统可用性量表(SUS)是一份包含10个问题的问卷,用来衡量你的产品在实际用户眼中的可用性感受。它由John Brooke于1986年在英国Digital Equipment Corporation开发,此后成为全球使用最广泛的可用性测量工具,拥有超过20,000次学术引用,并在软件、硬件、网站和应用程序中积累了数十年的实际应用经验。
问卷要求用户对十个陈述进行1到5分的评分——例如*“我觉得这个系统不必要地复杂”和”我觉得这个系统很容易使用。“*他们的回答被综合计算为一个0到100之间的单一分数。
这个分数不是百分比。70分并不意味着你的产品有70%是可用的。它意味着更具体的东西——也更有用。
你需要了解的基准数值
基于对500多项可用性研究的分析,研究人员为解读SUS分数建立了明确的阈值。
低于51分 — 存在严重的可用性问题。用户很可能在基本任务上遇到困难,有些人可能因为摩擦而完全放弃产品。这需要立即关注。
51–67分 — 低于平均水平。用户勉强能用,但体验费力。留存率和口碑传播将受到影响。
68分 — 所有被测产品的平均SUS分数。如果你在68分,说明你没有失败,但也没有脱颖而出。
68–80分 — 高于平均水平。用户总体上觉得你的产品可以用,但仍有很大的改进空间。
80分以上 — 这里开始变得有趣。研究表明,得分超过80分的产品被用户推荐的可能性显著更高。你已经从”可以接受”跨入了”真正优秀”的领域。
90分以上 — 卓越。只有用户觉得”用起来真舒服”的产品才能达到的水平。
为什么单一分数比你想象的更有用
对SUS最常见的反对意见是:它不告诉你哪里出了问题——只告诉你是否有问题。这是事实,也是刻意为之。SUS不是诊断工具。它不会告诉你哪个按钮放错了位置。
它做的是给你一个一致的、可比较的基准线。

这很重要,原因有三。
-
它从讨论中去除了主观意见。 当两个人对重新设计是否改善了体验意见不一时,前后对比的SUS分数不在乎谁的职位更高。数字说什么就是什么。
-
它让你可以跟踪进展。 今天71分只是一个数字。但经过三次发布从63分上升到71分的分数,讲述的是一个团队在有意识地进步的故事。
-
它给你提供了比较基准。 平均分是68。你所在行业的同行可能也聚集在这个水平附近。知道自己是79分还是54分,能告诉你在整体格局中的位置,而不仅仅是用户在上次可用性测试中是否点对了按钮。
何时进行测量
SUS在重复使用时效果最好,而不是一次性的。最有用的模式是在一致的时间间隔发送问卷——在重大发布之后、在显著的UI变更之后、或按季度节奏——这样你构建的是趋势线而不是快照。
单一分数告诉你现在在哪里。一系列分数告诉你所做的事情是否有效。
问卷本身用户只需不到两分钟即可完成。十个问题。没有需要整理的开放式反馈,没有需要观看的会话录像,没有需要编码的定性数据。你得到一个数字。你跟踪它。你就知道了。
低分怎么办
如果你的分数低于68,请克制住立即重新设计的冲动。SUS告诉你有问题,但没有告诉你是什么问题。正确的下一步是将分数与定性方法结合——用户访谈、会话回放、可用性测试——来找出摩擦的来源。
分数告诉你”去看看”。定性研究告诉你”看哪里”。
如果你的分数在68到80之间,问题就变成:哪些交互在拉低平均分?SUS不会直接回答这个问题,但它以一种直觉永远无法做到的方式驱动你去思考这个问题。
总结
好的SUS分数是一个在不断提升的分数。
一个从不变动的80分,不如一个已经攀升了六个月的62分有意义,因为上升的分数说明了你的团队是如何工作的——在衡量、在回应、在变得更好。
从基准线开始。运行问卷。拿到你的数字。然后给自己设定一个要超越的目标。