24小时故障咨询电话 点击右边热线,在线解答故障全国热线::123456
narutovk- 复仇女神的王者復仇之路_2027年要初步建立的“国家关键语料库”是什么?怎么建?

narutovk- 复仇女神的王者復仇之路

全国热线::123456

更新时间:

narutovk探寻真相,我的反派夫君小说引人入胜







narutovk- 复仇女神的王者復仇之路:(1)123456(点击咨询)(2)123456(点击咨询)









narutovk- 语文课代表的超能力:改写命运的力量(1)123456(点击咨询)(2)123456(点击咨询)





narutovk在严肃的会议中寻找乐趣:下添的启示

narutovk- 惊艳亮相:同志帅哥的街拍大片









专业售后培训:定期对售后团队进行专业培训,提升服务水平。




narutovk外星小子哆布哆:异星人的复仇









narutovk外科圣医:逆天改命的医学大师

 重庆市九龙坡区、济宁市兖州区、伊春市铁力市、达州市渠县、营口市站前区、文昌市重兴镇、双鸭山市岭东区、东莞市东城街道、湖州市南浔区





遵义市习水县、江门市新会区、郴州市北湖区、五指山市通什、衢州市开化县、白沙黎族自治县邦溪镇









广西百色市田阳区、辽阳市辽阳县、平顶山市宝丰县、哈尔滨市木兰县、常德市桃源县









延边敦化市、亳州市利辛县、漯河市郾城区、九江市湖口县、重庆市石柱土家族自治县、鹤岗市兴山区、万宁市三更罗镇、陵水黎族自治县隆广镇、临汾市永和县、陵水黎族自治县光坡镇









兰州市红古区、杭州市拱墅区、宜宾市高县、内蒙古呼伦贝尔市陈巴尔虎旗、锦州市太和区









青岛市即墨区、绥化市海伦市、重庆市涪陵区、安顺市普定县、焦作市山阳区、巴中市南江县、攀枝花市米易县、内蒙古包头市土默特右旗、九江市武宁县









丹东市凤城市、赣州市赣县区、吕梁市方山县、吕梁市文水县、商洛市商南县、儋州市新州镇、商丘市民权县、长治市沁源县、广西百色市右江区









吉林市桦甸市、东莞市寮步镇、芜湖市弋江区、酒泉市肃北蒙古族自治县、铜仁市松桃苗族自治县、达州市达川区、东方市八所镇、陵水黎族自治县英州镇、日照市东港区、哈尔滨市南岗区









新乡市延津县、洛阳市宜阳县、儋州市王五镇、成都市温江区、楚雄楚雄市、宜昌市五峰土家族自治县、广西崇左市天等县









延安市甘泉县、黔西南兴仁市、内蒙古兴安盟阿尔山市、东莞市沙田镇、济宁市鱼台县、铁岭市清河区、昆明市石林彝族自治县、扬州市邗江区、新余市分宜县









内蒙古包头市青山区、宁波市象山县、凉山普格县、陵水黎族自治县提蒙乡、潍坊市临朐县、南平市延平区、宁波市奉化区、商丘市睢阳区、铜仁市江口县









天津市武清区、宜宾市南溪区、直辖县神农架林区、遂宁市船山区、太原市晋源区、广西桂林市荔浦市、福州市长乐区、吉林市舒兰市、南充市顺庆区、南京市浦口区









齐齐哈尔市富裕县、临沂市郯城县、兰州市城关区、漯河市源汇区、广西南宁市邕宁区









德阳市广汉市、吉林市丰满区、郑州市荥阳市、广西河池市东兰县、怀化市沅陵县、嘉兴市海宁市、泰州市高港区、牡丹江市宁安市、大连市西岗区、临汾市大宁县









湛江市徐闻县、通化市二道江区、凉山越西县、荆州市公安县、安阳市林州市、黔东南镇远县、遵义市绥阳县、重庆市垫江县、渭南市韩城市









临夏永靖县、黔西南望谟县、衡阳市南岳区、阿坝藏族羌族自治州壤塘县、内蒙古通辽市库伦旗、福州市闽侯县









贵阳市息烽县、厦门市湖里区、定安县龙湖镇、齐齐哈尔市泰来县、湘西州永顺县、深圳市宝安区、阿坝藏族羌族自治州茂县、开封市鼓楼区、广西贺州市平桂区

2027年要初步建立的“国家关键语料库”是什么?怎么建?

  2027年要初步建立的“国家关键语料库”是什么 怎么建

  “当前,随着新一轮科技革命和产业变革,大语言模型、人工智能技术快速发展,语料库的建设规模与应用范围也经历了大幅度完善和拓展。”前不久,教育部语言文字信息管理司相关负责人提到,决定实施国家关键语料库共建共享计划,扩展关键领域,支持共建共享,推进应用转化,为全方位释放语言文字在经济社会发展中的数据要素价值奠定更加宽厚基础。

  近期,教育部、国家语委、中央网信办印发《关于加强数字中文建设 推进语言文字信息化发展的意见》(以下简称《意见》)。其中提到,到2027年,国家数字中文建设行动取得重要成效,语言文字数据要素价值有效释放。基本形成“政府主导、部门协同、社会参与、共建共享”的语言文字信息化工作机制;基本建成国家语言文字大数据中心,初步建成国家关键语料库和国家战略语言资源信息库;语言文字信息化标准、前沿语言技术、优质语言资源、新型语言服务等基础支撑能力显著增强。

  “国家关键语料库”是什么

  《意见》提出,推动基础性语言资源建设,实施国家关键语料库共建共享计划,重点支持建设大规模中文语料库及高质量民族语言文字语料库、手语盲文语料库、行业领域语料库、语言监测动态语料库等。

  教育部语言文字信息管理司相关负责人在接受中青报·中青网记者专访时提到,语料库是自然语言处理、大语言模型、人工智能技术创新应用的重要支撑,是经济社会信息化建设、数字化赋能和智能化发展的基础要素,促进语言数据赋能信息技术创新与信息技术赋能语言文字资源使用的双向赋能。

  以文化传承领域为例,目前已经建设了中华思想文化术语库、中华精品字库、甲骨文数据库、中国语言资源保护数据库等。

  其中,中华思想文化术语库包括了中华民族所创造或构建,凝聚、浓缩了中华哲学思想、人文精神、思维方式、价值观念,以词或短语形式固化的概念和核心词。该语料库中包括1200余条思想文化术语、中医文化关键词、典籍译本、典籍译名、博雅双语词等。

  教育部语言文字信息管理司相关负责人提到,2024年,智能化学习工具“AI小语”正式上线。“AI小语”是以中华思想文化术语库为基础训练语料、以大语言模型技术为核心技术的高交互感智能平台,对赋能中华优秀传统文化对内传承和对外传播具有重要意义。

  截至目前,教育部、国家语委通过组织开发、集成汇聚、动态更新等方式,组织高校、企业、科研院所等,建设大规模高质量语料库30余项,相关语料库已广泛应用于经济社会发展的关键领域。

  “国家关键语料库”怎么建

  “信息技术深刻融入经济社会发展各领域,需要推动语言文字与信息技术的深度融合,找准两者的结合点、融合点、发力点。”教育部语言文字信息管理司相关负责人说。

  长期以来,国家语委会同有关部门研制并发布了《信息技术中文编码字符集》等国家通用语言文字和民族语言文字信息化规范标准100多项,为自然语言处理技术在人工智能、数字产品和信息产业领域的应用创新奠定规范基础。

  面向人工智能时代,该负责人介绍,要开展语言资源建设、管理、应用、共享标准研究,重点推进语料库、数据标注、数据评价等规范标准的制订;服务教育教学,研制大语言模型能力素养(师生版),引导师生有效、安全使用大语言模型等人工智能技术;助力文化传承,研制甲骨文数字化共享技术标准。

  此外,既要支持语言文字信息处理基础标准研究,也要鼓励高校、企业开展行业标准、企业标准研制。加强与工信部、国家民委、国家标准委等部门单位合作。推动已有语言文字信息化相关规范标准的修订工作,加强已有规范标准的宣传推广等。

  在专业化人才队伍培养上,教育部语言文字信息管理司相关负责人提到,推动高校增设语言智能、计算语言学等交叉学科方向,增设“语言文字+人工智能”核心课程。此外,鼓励企业建设产教融合实训基地,开展中文信息处理、多语种机器翻译、语料加工处理、数据标注等技能培训,提升中文专业以及相关专业学生的职业技能,扩大就业范围和就业渠道。

  “今年是落实《教育强国建设规划纲要(2024-2035年)》的关键之年,语言文字信息化发展将展望十年、谋划五年、立足三年,把握赋能全局高度,加快试点先行进度,激发协同创新力度,在落实重点任务上下功夫、见实效。”在前不久举行的教育部新闻发布会上,教育部语言文字信息管理司司长刘培俊说。

  中青报·中青网记者 杨洁来源:中国青年报 【编辑:苏亦瑜】

相关推荐: