Grok 语音与技能重大更新

Grok Voice 与技能调用：AI 实时交互的实用跃升

Grok Voice Think Fast 在 Artificial Analysis 语音基准中领先 OpenAI 和 Gemini，却以低价和工具集成打开了从对话到行动的通道，这或许标志着消费级 AI 代理从演示走向生产力的转折。 [1] [2]

核心结论

Grok Voice Think Fast 确立了实时语音代理的实用领先地位。 其在复杂客服场景下的解决率和自然流畅度超越主要竞品，平均对话时长 5.6 分钟，证明低延迟推理已可落地企业服务。 [1]

Grok Web 技能调用让大模型从聊天工具进化成可组合代理。 用户通过 / 命令调用预设技能，结合工具调用能力，显著提升日常工作流效率，而非仅停留在生成内容层面。 [3]

xAI 此轮更新以性价比加速 AI 代理普及，而非单纯追求参数规模。 低至每分钟 0.05 美元的 Voice Agent API 定价，正在重塑开发者与企业的采用门槛。 [4]

52.1% — Grok Voice Think Fast 1.0 在 Artificial Analysis τ-Voice 基准中的得分，领先竞争对手
5.6 分钟 — 平均对话时长，体现其在真实客服场景中的端到端解决能力
$0.05/分钟 — Grok Voice Agent API 定价，处于中低位区间，具有明显成本优势
70% — 在 Starlink 客服中自主解决查询的比例，验证了落地价值
/ 命令 — Grok Web 技能调用触发方式，用户可快速激活预设代理

🧑‍💻 技术从业者
立即在 Grok Web 测试技能调用，构建一个结合 Web Search 和自定义函数的个人工作流代理；集成 Grok Voice API 到现有客服或语音产品原型中，验证中文场景表现。

🏢 企业决策者
评估将 Grok Voice Agent 替换部分一线客服流程，优先试点高频重复查询场景；要求团队调研 xAI 工具调用 API 与企业内部系统的连接可行性，制定 3 个月试点计划。

📈 投资人与行业观察者
密切跟踪 xAI 后续在机器人（尤其是 Optimus）和 Starlink 生态中的语音/技能集成进展；对比 OpenAI、Anthropic 的代理定价与生态封闭度，判断开放工具调用对市场份额的影响。

@Rand [Verified]说道：

grok voice 目前绝对是最好的语音模型，已经领先一年了

(立场: 支持 | 👍 13)

回复
@StephenP48273说道：

SuperGrok 用户的 Grok Voice 每天被严格限制在 30 分钟以内，这看起来是为了 xAI IPO 而故意压缩消费者业务。语音模式是 Grok 唯一领先 Claude 的地方，如果限制不改我就要取消订阅了。

(立场: 反对 | 👍 15)

回复
@1nc0nito_说道：

Elon，能不能自定义 Grok Voice？我想让他用 Burnie Sanders 那个老苏联特工的声音，那会超级搞笑！

(立场: 幽默 | 👍 43)

回复
@snehalsurti说道：

纸面上不错。但真正考验是能不能处理 Karen 半夜两点为延迟包裹大喊大叫、每10秒改一次说法的长对话。那才是语音 AI 通常崩盘的地方，期待实际表现。

(立场: 中立 | 👍 19)

回复
@teh_itachi69说道：

Ayylmao，Grok 听起来真的像外星人，真的。

(立场: 幽默 | 👍 32)

回复