硬件资源
软件资源
平台资源
AI集群(智算)
AI集群采用K8S+Docker构建,为每一个AI计算提供完全独立的环境。集群可以帮助用户轻松上传私有镜像或从外部docker社区容器库导入镜像进行开发和训练。集群通过友好的图形化界面帮助用户大幅降低学习成本,快速完成计算环境的部署并展开自己的科研计算。目前AI集群有25个计算节点,CPU合计1584核,GPU合计146张。
CE集群(超算)
该集群采用高性能计算集群管理软件管理软硬件资源,并根据集群中的资源使用情况来合理地调度用户提交的作业,从而达到提高资源的利用率和作业的执行效率的作用。目前CE集群有29个计算节点,CPU合计1344核,GPU合计38张,DCU合计8张。
OD集群(超算)
OD集群在架构和使用方法上和CE集群类似,但其计算节点拥有图形化界面,同时该集群的所有计算节点可以直接连接外网,在功能上是对CE集群很好的补充。目前OD集群有27个计算节点,CPU合计782核,GPU合计18张。
存储
并行文件系统使集群里所有计算节点都可通过单一文件目录读写存储系统里的文件,并且满足大规模随机 IO、频繁的读写操作、通信密集的要求。高性能计算平台采用稳定性良好的商业版并行存储,裸存储容量2PB。
计算网络
平台采用IB HDR 200G网络架构,现阶段为100G带宽。
CE集群软件资源 | |||
软件类型 |
名称 |
可用版本 |
说明 |
编译器 |
GNU Compiler |
4.8.5 7.5 8.3 10.02 |
GNU编译器 |
Intel Compiler |
2018u1 2020u1 |
Intel编译器 |
|
intel oneapi |
2021.3.0 |
Intel oneapi编译器 |
|
CUDA |
10.0 11.0 11.4 |
cuda编译器 |
|
程序语言 |
Julia |
1.6.2 |
科学计算语言,可以替代matlab |
go |
1.15.3 |
一种静态强类型、编译型、并发型,并具有垃圾回收功能的编程语言 |
|
matlab |
2021a |
工程计算软件 |
|
python |
3.6.7 3.7.3 3.9.6 |
流行的编程语言 |
|
R |
4.1 |
用于统计分析、绘图的语言和操作环境 |
|
软件(数据科学) |
stata |
16 |
数据分析、数据管理以及绘制专业图表的完整及整合性统计软件 |
软件(材料科学) |
cp2k |
8.2 |
基于密度泛函理论的从头算分子动力学软件 |
计算环境 |
anaconda |
2019.10 2021.5 |
开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项 |
singularity |
3.5.2 |
用于操作系统级虚拟化,也称为容器化 |
AI集群镜像资源 | |
PyTorch |
开源的python机器学习库 |
TensorFlow |
用于各类机器学习算法的编程实现 |
Caffe |
(全称:Convolutional Architecture for Fast Feature Embedding),是一个计算CNN相关算法的框架 |
MxNet |
一个开源深度学习软件框架,用于训练及部署深度神经网络 |
PaddlePaddle |
飞桨开源框架是一个易用、高效、灵活、可扩展的深度学习框架 |