在全球迈向“智能体时代”的背景下,OpenCSG(开放传神)近日发布与戴尔科技基础设施深度集成的参考架构方案。该方案结合了 OpenCSG 的 CSGHub 企业级平台、Xnet 智能传输协议、Dell PowerScale 智能存储系统和 Dell Pro Max with GB10 高性能计算节点,旨在为企业提供从开发到生产的全面技术支持,推动智能技术的广泛应用。
针对企业智能化转型中的“算力不充分、数据利用低、流程不连贯”这三大问题,方案通过将数据资产放在核心位置,帮助企业平稳过渡到智能架构,进一步推动智能技术的大规模应用。
CSGHub 作为 OpenCSG 的核心平台,将 Dell Pro Max with GB10 的算力和 PowerScale 智能存储整合到同一套工作流中。这一工作流涵盖了从数据采集、特征处理、模型训练、评估到上线,再到后续的监控、回滚与再训练。所有流程都可以在 CSGHub 上完成管理,企业可以统一管理数据和模型,同时还能在不同项目和团队之间积累宝贵的研发经验。
其中,Dell Pro Max with GB10将数据中心级的 Grace Blackwell 架构压缩进一台桌面设备,128GB 统一内存全部可供 GPU 使用,使企业开发者在本地即可加载 70B 乃至 200B 级模型的量化版本,在不依赖云端的情况下完成智能体原型开发、LoRA 微调和多智能体系统调试。
Xnet:解锁 AI 算力与数据协同的新引擎
作为本次联合方案的核心技术亮点之一,OpenCSG 自主研发的 Xnet 企业级分布式计算与数据互联协议层,打破了算力与数据的传输瓶颈。Xnet 并非独立的工具,它深度集成在 CSGHub 中,负责处理数据和模型的流转。所有数据集、模型 checkpoint 和实验结果都能通过 Xnet 高效地在本地设备、数据中心和存储系统之间流动。OpenCSG Xnet 带来的三重价值:
价值一:模型与数据的“Git 化”流转方式Xnet 实现了“模型即资源”的内部流通体系,企业可以像使用 Git 管理代码一样,高效、安全地分发和管理 AI 模型与数据资产。价值二:与戴尔基础设施的深度协同
Xnet 将 Dell Pro Max with GB10与 PowerScale 智能存储无缝整合为一个“智能原生智算网络”。
GB10 负责动态推理与训练调度。
PowerScale 作为高并发、高弹性的数据后端。
Xnet 负责其间的智能化算力与数据调度与增量传输。
价值三:在企业环境中的实际效益相比传统基于 HTTP/FTP 的全量传输,Xnet 采用“文件级 + 分块级”智能增量机制,并结合多线程并发与断点续传。这意味着,从本地到集群、从 Staging 到 Production 的频繁版本同步,真正变成日常工程操作,而不再是让团队望而却步的基础设施难题。
直面企业智能化核心痛点,实现多维关键突破
本次方案聚焦解决企业智能化转型过程中常见的几个挑战,包括“数据低效、算力浪费、流程不协调”等,方案亮点体现在多个层面:
提高数据提交效率:利用 OpenCSG 自研的 Xnet 协议,每次提交的数据量可以从 GB 降低到 KB,企业仅需上传变化的数据块,从而显著提升开发效率。
实现数据的无缝共享:同一份数据可以在不同环节中无缝流转,如在训练、分析和报告生成等过程中,不再需要重复存储或迁移数据,节省了存储空间,降低了时间成本。
释放 GPU 算力潜力:通过与 Dell PowerScale 智能存储的直连,消除了 GPU 的空闲等待时间,确保计算资源的高效使用,提升了算力的产出和投资回报。
端到端智能工程化编排:以 CSGHub 为核心,企业能够在统一平台上管理数据集、实验、模型版本、流水线编排和发布。CSGHub 将智能体的生命周期管理形成标准化流程,不仅让 AI 项目从验证到大规模应用更有据可循,也减少了对特定人员的依赖,将研发经验转化为团队能力。
从个人开发到生产集群的一体化智能基础架构:该方案将开发、测试和生产环境整合在同一算力和存储平台上:
开发者桌面上的单台 Dell Pro Max with GB10,可平滑扩展为多台的团队组网;
再进一步扩展到 2~4 台以上的测试集群;
操作系统、容器编排和智能平台始终保持一致,避免企业常见的“PoC 阶段顺利,生产环境全崩溃”的问题。
从单机 POC 到企业级 Production:一条可演进的架构路径
在架构设计上,这套方案给出的不是一张抽象的“生产大图景”,而是一条可落地、可演进的路径:
Develop & POC 阶段:单台 Dell Pro Max with GB10,本地 DGX OS 环境,通过 10GbE 接入 Staging 环境,完成模型探索与智能体原型开发。
Staging 阶段:多台 Dell Pro Max with GB10 组成 K8s/K3s 集群 + PowerScale F210 + 200GbE + Dell 备份,用于 CI/CD、集成测试和中等规模训练。最佳实践:4台为一个标准集群,可多个标准集群扩展。
Production 阶段:8 台以上 GB10 + PowerScale F210 + A3100 分层存储 + 200GbE + Dell 备份,面向全量训练和线上推理。
在工程实践上,这套方案把 “Develop/POC → Staging → Production” 串成了一个单向收敛的闭环:整个过程形成一个可持续、可扩展的闭环,开发者完成原型后,只需将镜像和配置推送到 Staging 集群,由流水线自动完成测试、验证和训练;验证后,镜像可无缝迁移至生产环境,确保项目从 PoC 到生产的顺利过渡。