24小时故障咨询电话 点击右边热线,在线解答故障全国热线::123456
张杰上康熙来了- 星际偶像:开启星际冒险之旅

张杰上康熙来了- 星际偶像:开启星际冒险之旅

全国热线::123456

更新时间:

张杰上康熙来了- 拳坛传奇:欧美拳击比赛中的经典瞬间







张杰上康熙来了- 星际偶像:开启星际冒险之旅:(1)123456(点击咨询)(2)123456(点击咨询)









张杰上康熙来了- 神秘女子养生spa:探索私密之谜(1)123456(点击咨询)(2)123456(点击咨询)





张杰上康熙来了- 欧美多人团队的野外恋爱秘密

张杰上康熙来了- 爱的冒险家:勇敢探索爱的冒险之旅









维修服务远程监控服务,实时关注:为客户提供家电远程监控服务,通过智能设备实时关注家电运行状态,及时发现并解决问题。




张杰上康熙来了- 欧时肥胖老太的背后真相:不一样的生活









张杰上康熙来了- 色气十足:女模特的性感风采

 郑州市新密市、大庆市龙凤区、延安市延川县、铁岭市西丰县、上海市金山区、贵阳市开阳县、赣州市定南县





金华市磐安县、东方市东河镇、周口市川汇区、西双版纳景洪市、南京市江宁区









北京市房山区、阜新市阜新蒙古族自治县、哈尔滨市通河县、酒泉市肃州区、兰州市皋兰县









怀化市芷江侗族自治县、迪庆维西傈僳族自治县、渭南市合阳县、铜仁市碧江区、衢州市龙游县、广西百色市右江区、澄迈县老城镇、内蒙古呼伦贝尔市根河市、甘孜得荣县









郑州市二七区、阳泉市郊区、广安市广安区、上海市松江区、白沙黎族自治县南开乡、内蒙古赤峰市红山区、兰州市榆中县、宁夏银川市金凤区、内江市市中区、宝鸡市陇县









驻马店市上蔡县、梅州市蕉岭县、儋州市那大镇、绵阳市三台县、新乡市牧野区、长治市平顺县、永州市蓝山县









齐齐哈尔市铁锋区、常州市金坛区、白银市白银区、晋城市沁水县、常州市新北区、吕梁市兴县、济南市历城区、阿坝藏族羌族自治州松潘县、三亚市崖州区









黑河市逊克县、贵阳市修文县、内蒙古鄂尔多斯市鄂托克前旗、牡丹江市穆棱市、榆林市吴堡县、贵阳市乌当区、昭通市永善县、朔州市右玉县









内蒙古鄂尔多斯市准格尔旗、临夏临夏市、毕节市纳雍县、葫芦岛市南票区、鞍山市台安县、甘南合作市、温州市泰顺县、枣庄市山亭区、阜阳市颍上县









吕梁市离石区、红河弥勒市、广州市越秀区、红河河口瑶族自治县、牡丹江市林口县、湛江市坡头区









晋城市沁水县、池州市贵池区、长沙市雨花区、天津市红桥区、大连市瓦房店市









大理祥云县、马鞍山市花山区、黔东南台江县、延安市黄龙县、吉林市船营区









兰州市皋兰县、晋中市左权县、阿坝藏族羌族自治州松潘县、滨州市沾化区、广西桂林市龙胜各族自治县、菏泽市曹县









永州市宁远县、宜春市宜丰县、内蒙古乌兰察布市四子王旗、宁波市慈溪市、汉中市略阳县、清远市清新区









内蒙古赤峰市喀喇沁旗、商丘市夏邑县、西安市高陵区、澄迈县金江镇、昌江黎族自治县七叉镇、万宁市大茂镇、杭州市富阳区、盐城市盐都区









平顶山市鲁山县、大兴安岭地区漠河市、扬州市江都区、乐东黎族自治县志仲镇、儋州市南丰镇、阿坝藏族羌族自治州黑水县、岳阳市汨罗市









成都市崇州市、淄博市沂源县、清远市连山壮族瑶族自治县、平凉市静宁县、内蒙古锡林郭勒盟二连浩特市

大国工匠丨大国重器九天大模型是如何打造的?“AI工匠”带你揭秘

  近两年,人工智能大模型日益受到社会关注,AI+算力正在驱动千行百业的智能化转型。

  有一位“AI工匠”王斌,他带领团队驾驭大规模国产智算集群,训练出了一套全系统自主可控的九天大模型,打造面向未来的大国重器。

  中国移动研究院人工智能中心高级总监 王斌:这是北京市最典型的一个覆盖居民区的基站,类似的基站中国移动已经开通了686万台,这些基站实际上每天会消耗大量的电力。

  信号基站引入九天人工智能大模型技术,对海量手机流量信号精确预测,给出每台基站的智能节能方案,全国600多万台基站通过人工智能等多种技术实现全年节电2.5亿度。

  王斌:我们的大模型的定位,不光是要能够写诗作画,除了能够识别传统的文本类和图片类知识,它还要能看得懂像这种雷达、红外,这种射频信号。

  抢抓人工智能发展的历史机遇,2023年初,我国提出,根据通信、电力、交通物流、能源等领域的需求,使用国产软硬件,打造人工智能大模型,形成自主可控的全新的产业生态。

  作为中国移动研究院AI技术专家,王斌有十多年芯片研发技术背景,之后又投入人工智能这一新赛道,是我国为数不多的既精通AI芯片又熟悉AI模型的技术人员。训练九天大模型这一国之重器的任务就落在了王斌团队肩上。

  王斌:这是我们的一个机房,智算的服务器就在这个机架里面。

  记者:有多少台?

  王斌:整个楼里面一共有2304台服务器,折算成AI加速卡的话,超过1.8万张。

  这个全国规模最大的软硬件都基于国产技术的智算集群就是九天大模型的最强大脑。

  王斌带领团队,收集了近500万亿字符的原始文本数据,几乎涵盖了人类有史以来全量的文本类知识,从中筛选出超10万亿字符的高质量训练数据集。让大模型记住这些知识不难,难的是怎么学会运用,这正是王斌必须迈过的第一道关卡。

  王斌:大模型的结构跟咱们人类的大脑结构是比较类似的,像人类大脑也有差不多1000亿个神经元,可能不同的神经元是负责不同的任务。我们平时做数学题用到的神经元,跟做语文题用到的神经元可能是不一样的。

  记者:所以这大模型也是这么分的?

  王斌:像一个千亿的大模型,我们要拆成18000份,每一个芯片在训练它所负责那部分的时候,都要高效地从这些数据中把知识萃取出来。

  大模型的18000张芯片要学会理解知识之间的逻辑关系,还要各有分工,彼此联动,逐渐变得聪明起来,王斌带领团队给大模型设计学习知识的算法、控制学习进程、矫正大模型的价值观。然而,他却碰到了一个棘手的难题。

  王斌:在我们这个行业,有个说法叫得开发者得天下。像国际主流AI芯片,它的开发者人数有好几百万,它会有很多优化的手段,这种优化手段会带来整个训练效率的提升。咱们现在国内的AI芯片,它的开发者人数可能都不到10万,可能里面还会有很多缺陷,只能说是一个坑一个坑去蹚,一个坎一个坎去迈。

  从系统设计到功能模块开发,近150名工程师历时一年半时间,写出了超过120万行的代码,构建了一套完整的平台软件,瞄准国际先进行列,加速追赶。

  这个智算集群里的18000张芯片运行时,好像一个庞大的方阵,整齐划一,共同推进,只要有一张卡出现问题,就会导致整个方阵混乱,训练任务失败。在训练了两个月的时候,这一巨大方阵就出现了严重故障。王斌带领技术骨干扎入18000张卡的数字深海,一层层排查,直到智算集群最底部。

  中国移动研究院人工智能中心高级工程师 丛鹏宇:王斌原来积累的硬件知识,在做大模型训练过程中,特别是排障过程中,其实发挥了很重要的作用。有很高的技术的前瞻性和技术的敏感性,能够指导大家从更加广泛的角度、更加有建设性的角度来解决问题。

  7天后终于找到了一张故障卡。然而,这7天的停滞却导致整个训练任务要从头再来。

  王斌:这么大规模的资源,已经执行了这么长时间任务,整个效果要清零是多么大的一个打击。为了解决这个问题,我们必须有一个即时检测技术。

  半年多,王斌带领团队对上万次大大小小的故障逐个分析,找到每一个故障的根本原因,归类整理,做出了一份故障处置清单,打造了一套自动检测软件,把各类故障的排查恢复时间从几天缩短到了十几分钟。

  在王斌团队的努力下,国产AI芯片在万卡规模上的训练效率达到同代国际主流AI芯片水平,为后续国产芯片在其他领域更广泛的应用打下了坚实基础。

  目前九天大模型已经进入了通信、石油生产、农业种植、智能制造等很多领域,正在用智慧赋能新质生产力。2025年1月,九天大模型被评为央企大国重器。

  中国信息通信研究院人工智能研究所平台与工程化部副主任 董昊:九天大模型不仅是我们自主技术的一种突破,同时也为我们国家大模型的应用落地提供了可复制可借鉴的成熟解决方案。

  王斌:国家给了我们这种期许,能够用国产算力实现对国际主流算力的替代,我们九天大模型还在持续迭代升级,在AI赛道上任重道远,我们有信心有决心来应对挑战。 【编辑:张燕玲】

相关推荐: