昇腾910B显卡满载功耗测试 昇腾910B显卡满载功耗测试一、安装测试工具 参考链接:https://www.hiascend.com/document/detail/zh/mindx-dl/60rc2/toolbox/ascenddmi/toolboxug_0004.html 下载Toolbox的deb安装包 链接:https://www.hiascend.com/developer/download/community 2024-11-07 测试 > 信创POC测试
01-智算中心的建设成本 转载:公众号:IT技术分享-老张 前言智算中心的建设成本大家都比较清楚了,以H100千卡集群为例,整体预算要3个多亿,其中H100整机的八卡整机占比最高,目前市场价一台约240w,仅128台H100就要3个亿,还有配套的IB或者Roce网络也需要2-3千万,以及存储系统(并行文件存储)、安全配套设备以及运维运营平台等费用也需要1千万左右,如果涉及液冷方案还需增加1千万左右,所以H100千卡的预 2024-10-17 运维 > (六)智算中心
02-一文搞懂H100H200,B100B200,B200GB200,HGXDGX的区别和参数 转载至公众号:IT技术分享-老张 前言最近英伟达GPU热点一直很高,尤其是对H200,B200的讨论,当然也包括GB200,DGX及HGX等,我简单汇总了以下几个问题,我们今天展开聊聊! 1、你清楚H200比H100升级了什么吗?B200与B100的区别呢? 2、B200和GB200名字看着很像,有何区别与联系呢? 3、我们常见到HGX和DGX,他们是什么产品以及两者间的区别和联系? 4、H 2024-10-17 运维 > (六)智算中心
高性能GPU服务器硬件拓扑和集群组网 转载自:http://arthurchiao.art/blog/gpu-advanced-notes-1-zh/#11-pcie-%E4%BA%A4%E6%8D%A2%E8%8A%AF%E7%89%87 感谢原作者的分享!在此基础上改动为个人版本。 1 术语与基础大模型训练一般都是用单机 8 卡 GPU 主机组成集群,机型包括 8*{A100,A8 2024-10-12
Mellanox网卡安装驱动 Mellanox网卡安装驱动文档作用: 在旧版本操作系统中(如Cenos7.4),部分网卡不能识别出来,需要手动安装驱动。 一、查看网卡BMC界面查看安装了7张网卡,共13个网口 在系统中使用lspci也可以看到13个网口 [root@localhost ~]# lspci | grep Mellanox 04:00.0 Ethernet controller: Mellanox Techn 2024-09-09 杂记
day79-LVS与JumpServer 今日内容: LVS负载均衡 OpenVPN加密通信隧道 JumpServer跳板机 一、负载均衡介绍1.1 常见负载均衡对比 常见负载均衡对比 优势 缺点 硬件:如F5负载均衡 性能好、购买有技术支持 价格昂贵,且一次需要购买2台凑成1对。 LVS 工作在4层,效率极其高 需要部署维护(运维成本较高) Nginx/Tengine/Openresty(lua 2024-08-21 运维 > (二)综合架构
Centos改网卡名 掌握如何将Centos的网卡名修改为eth命令格式 一、临时生效为防止重启后网卡名乱变,统一改成eth0,eth1这种格式 1、重启系统,在grab界面按E,编辑 2、修改启动项,添加 net.ifnames=0 biosdevname=0 Ctrl + X保存退出,重启后网卡名已改名,由ens33改为eth0 3、修改网卡配置文件,把网卡名修正 cd /et 2024-08-02 杂记
人工智能集群了解 一、InfiniBand算力网络1.1 技术背景infiniband直译为“无限带宽”技术,是一个高性能计算的计算机网络通信标准。大致发展路线如下: 上世纪90年代:为了连接更多的外部设备,英特尔推出PCI总线,刚开始都用这个 1999年,FIO Developers Forum(IBM、康柏以及惠普)和NGIO Forum(英特尔、微软、SUN)进行了合并,创立了InfiniBand贸易协会 2024-08-02 杂记
day02-网工入门(二) 网工入门(二)一、IP地址和子网掩码1.1 IP地址概念什么是IP地址? IP地址是用来标识网络中一台主机的唯一标志 通常采用32位点分十进制表示 IP地址分为两部分:网络位和主机位 网络位:表示某一个IP子网 主机位:表示本IP子网内的某台主机 怎么区分IP地址的网络位和主机位?需要用到子网掩码的知识 1.2 子网掩码它是用来区分IP地址的网络位和主机位的,用连续的1来表示网络位,用连 2024-07-28 网络 > 1、网工入门
day01-网工入门(一) 网工入门(一)一、华为认证的级别华为认证有三个级别 HCIA 基础网工 HCIP 高级工程师 HCIE 网络专家 二、网络工程师学习路线1、入门(使用华为2020年HCIA资料) OSI七层模型 常见的网络设备功能和原理 通信原理 交换原理 路由原理 2、进阶 如何组建高可靠性网络 VRRP MSTP 堆叠(CSS/IRF/VSU) 多出口 网络高性能 动态路 2024-07-27 网络 > 1、网工入门
day03-HCIA课程(一) HCIA课程(一)零、设备基础配置网络拓扑 0.1 设备系统参数的配置方法 设备名称、系统时间、时区 查看系统信息 display version # 可以查看路由器的软件版本与设备名称 # VRP...Version 5.1.60... # Huawei AR2220E ... 修改系统时间 # 修改方式一 clock time zone Local add 08:00:00 # 修改方式 2024-07-27 网络 > 2、HCIA课程
day78-Devops-Jenkins(四)-完结 Devops架构-Jenkins-04-完结今日内容: 案例07–jenkins+ansible实现项目自动化 一、Jenkins+Ansible实现1.1 整体流程 开发书写、提交代码 + Dockerfile(代码已做修改并提交成V3.0,网页标题改为Flappy Bird V3.0!) jk 拉取代码 jk 构建镜像并推送到私有仓库 jk 管理web,在web上拉取镜像并运行容器(之前的 2024-07-18 运维 > (二)综合架构