什么是好的SUS分数，以及它为什么对你的业务很重要

许多产品团队从未听说过系统可用性量表（System Usability Scale，简称SUS），所以当第一次拿到调查结果、看到71分时，会想”……这算好吗？“——这完全可以理解。

简短的回答是：高于平均水平，但还不至于让用户主动向别人推荐你的产品。

以下是你的分数真正意味着什么——以及如何利用它来改进你的设计策略。

什么是系统可用性量表

系统可用性量表（SUS）是一份包含10个问题的问卷，用来衡量你的产品在实际用户眼中的可用性感受。它由John Brooke于1986年在英国Digital Equipment Corporation开发，此后成为全球使用最广泛的可用性测量工具，拥有超过20,000次学术引用，并在软件、硬件、网站和应用程序中积累了数十年的实际应用经验。

问卷要求用户对十个陈述进行1到5分的评分——例如*“我觉得这个系统不必要地复杂”和”我觉得这个系统很容易使用。“*他们的回答被综合计算为一个0到100之间的单一分数。

这个分数不是百分比。70分并不意味着你的产品有70%是可用的。它意味着更具体的东西——也更有用。

你需要了解的基准数值

基于对500多项可用性研究的分析，研究人员为解读SUS分数建立了明确的阈值。

低于51分 — 存在严重的可用性问题。用户很可能在基本任务上遇到困难，有些人可能因为摩擦而完全放弃产品。这需要立即关注。

51–67分 — 低于平均水平。用户勉强能用，但体验费力。留存率和口碑传播将受到影响。

68分 — 所有被测产品的平均SUS分数。如果你在68分，说明你没有失败，但也没有脱颖而出。

68–80分 — 高于平均水平。用户总体上觉得你的产品可以用，但仍有很大的改进空间。

80分以上 — 这里开始变得有趣。研究表明，得分超过80分的产品被用户推荐的可能性显著更高。你已经从”可以接受”跨入了”真正优秀”的领域。

90分以上 — 卓越。只有用户觉得”用起来真舒服”的产品才能达到的水平。

为什么单一分数比你想象的更有用

对SUS最常见的反对意见是：它不告诉你哪里出了问题——只告诉你是否有问题。这是事实，也是刻意为之。SUS不是诊断工具。它不会告诉你哪个按钮放错了位置。

它做的是给你一个一致的、可比较的基准线。

Office worker is making presentation to colleagues talking writing on whiteboard discussing marketing strategy. People and business discussions concept.

这很重要，原因有三。

它从讨论中去除了主观意见。 当两个人对重新设计是否改善了体验意见不一时，前后对比的SUS分数不在乎谁的职位更高。数字说什么就是什么。
它让你可以跟踪进展。 今天71分只是一个数字。但经过三次发布从63分上升到71分的分数，讲述的是一个团队在有意识地进步的故事。
它给你提供了比较基准。 平均分是68。你所在行业的同行可能也聚集在这个水平附近。知道自己是79分还是54分，能告诉你在整体格局中的位置，而不仅仅是用户在上次可用性测试中是否点对了按钮。

何时进行测量

SUS在重复使用时效果最好，而不是一次性的。最有用的模式是在一致的时间间隔发送问卷——在重大发布之后、在显著的UI变更之后、或按季度节奏——这样你构建的是趋势线而不是快照。

单一分数告诉你现在在哪里。一系列分数告诉你所做的事情是否有效。

问卷本身用户只需不到两分钟即可完成。十个问题。没有需要整理的开放式反馈，没有需要观看的会话录像，没有需要编码的定性数据。你得到一个数字。你跟踪它。你就知道了。

低分怎么办

如果你的分数低于68，请克制住立即重新设计的冲动。SUS告诉你有问题，但没有告诉你是什么问题。正确的下一步是将分数与定性方法结合——用户访谈、会话回放、可用性测试——来找出摩擦的来源。

分数告诉你”去看看”。定性研究告诉你”看哪里”。

如果你的分数在68到80之间，问题就变成：哪些交互在拉低平均分？SUS不会直接回答这个问题，但它以一种直觉永远无法做到的方式驱动你去思考这个问题。

总结

好的SUS分数是一个在不断提升的分数。

一个从不变动的80分，不如一个已经攀升了六个月的62分有意义，因为上升的分数说明了你的团队是如何工作的——在衡量、在回应、在变得更好。

从基准线开始。运行问卷。拿到你的数字。然后给自己设定一个要超越的目标。