跳转到主内容
跳转到主内容

上线生产环境

在生产环境部署 ClickStack 时,为确保安全性、稳定性以及正确配置,还需要额外考虑若干事项。这些事项会因所使用的分发方式——开源或托管——而有所不同。

对于生产环境部署,推荐使用 Managed ClickStack。它默认采用业界标准的安全实践,包括增强的加密、身份验证与连接能力以及托管访问控制,并同时提供以下优势:

  • 计算资源可独立于存储自动伸缩
  • 基于对象存储的低成本且几乎无限的数据保留能力
  • 能够使用 Warehouses 将读写工作负载进行独立隔离
  • 集成身份验证
  • 自动化备份
  • 无缝升级

在使用 Managed ClickStack 时,请遵循适用于 ClickHouse Cloud 的这些最佳实践

保护摄取安全

默认情况下,当在开源发行版之外部署时,ClickStack OpenTelemetry Collector 未进行安全加固,并且在其 OTLP 端口上不要求身份验证。

要实现安全摄取,请在使用 OTLP_AUTH_TOKEN 环境变量部署 collector 时指定身份验证令牌。有关更多详细信息,请参见“Securing the collector”

创建摄取用户

建议为 OTel collector 创建一个专用用户,用于向 Managed ClickHouse 进行摄取,并确保摄取数据被发送到特定的数据库,例如 otel。有关更多详细信息,请参见“Creating an ingestion user”

配置生存时间 (TTL)

请确保为你的 Managed ClickStack 部署生存时间 (TTL)进行了适当配置。这将控制数据的保留时长——默认值为 3 天,通常需要进行调整。

资源估算

在部署 Managed ClickStack 时,务必预配足够的计算资源,以同时处理摄取和查询工作负载。以下估算值根据您计划摄取的可观测性数据量,提供了一个基准起点

每月摄取量推荐计算资源
< 10 TB / 月2 vCPU × 3 个副本
10–50 TB / 月4 vCPU × 3 个副本
50–100 TB / 月8 vCPU × 3 个副本
100–500 TB / 月30 vCPU × 3 个副本
1 PB+ / 月59 vCPU × 3 个副本

这些建议基于以下假设:

  • 数据量指每月未压缩摄取量,同时适用于日志和链路追踪。
  • 查询模式符合典型的可观测性使用场景,大多数查询都针对近期数据,通常为最近 24 小时内的数据。
  • 摄取在整个月内相对均匀。如果您预计会出现突发流量或峰值,则应预留额外余量。
  • 存储通过 ClickHouse Cloud 对象存储单独处理,因此不会成为保留期限的限制因素。我们假设保留时间较长的数据不会被频繁访问。

对于经常查询更长时间范围、执行高强度聚合,或需要支持大量并发用户的访问模式,可能需要更多计算资源。

尽管对于给定的摄取吞吐量而言,两个副本即可满足 CPU 和内存需求,但我们仍建议在条件允许时使用三个副本,以实现相同的总容量并提升服务冗余性。

注意

这些数值仅为估算,应作为初始基准使用。实际需求取决于查询复杂度、并发度、保留策略以及摄取吞吐量的波动。请始终监控资源使用情况,并按需扩缩容。

隔离可观测性工作负载

如果你在一个已经支持其他工作负载 (例如实时应用分析) 的现有 ClickHouse Cloud 服务中新增 ClickStack,强烈建议将可观测性流量进行隔离。

使用 Managed Warehouses 创建一个专用于 ClickStack 的子服务。这样可以:

  • 将摄取和查询负载与现有应用相互隔离
  • 独立扩缩可观测性工作负载
  • 防止可观测性查询影响生产分析
  • 在需要时在服务之间共享相同的底层数据集

这种方式可以确保你现有的工作负载不受影响,同时允许 ClickStack 随着可观测性数据的增长而独立伸缩。

对于更大规模的部署或定制规格建议,请联系支持以获取更精确的评估。