近期,教育部、国家语委以及中央网信办共同颁布了《关于强化数字中文建设,推动语言文字信息化发展的指导意见》。该文件中,一个新提出的术语——“国家关键语料库”引起了广泛关注。大家普遍期待,这一概念有望在未来的日常生活和学习中产生深远影响。
文件目标规划
至2027年,我国国家数字中文建设行动预期将实现显著进展。届时,以政府为主导、多个部门协同合作、社会广泛参与的、致力于共同促进与共享的语言文字信息化工作模式将初步形成。同时,国家语言文字大数据中心的建设工程将进入尾声。国家关键语料库以及战略语言资源信息库的初步构建工作也已启动。这一进程将显著增强语言文字信息化的基础支撑能力。
关键语料库定义
教育部语言文字信息管理司的相关负责人指出,语料库在自然语言处理等技术创新领域中具有至关重要的地位中国语言文字使用情况调查资料,构成了信息化社会建设不可或缺的基本组成部分。此类语料库促进了语言数据与信息技术领域的相互促进。例如,在文化传承方面,已经成功建立了包含中华思想文化术语库在内的众多关键语料库。
库建设意义
国家关键语料库的价值十分突出。该库对自然语言处理等科技领域的创新发展给予了有力支持,并推动了经济社会数字化转型的快速发展。在文化传承领域,它对传统文化的保护与传承发挥了重要作用,同时也有助于文化的广泛传播和交流。以中华精品字库为例中国语言文字使用情况调查资料,它让更多的人有机会了解和领略汉字的魅力。
建设具体举措
在人工智能技术不断进步的时代,我们必须对语言资源建设等领域进行深入探究,尤其是要着力构建语料库的规范与标准。与此同时,为了更好地服务于教育教学,我们应着力提高开发大型语言模型的能力和素质,旨在引导师生正确运用人工智能技术。另外,还需推动甲骨文数字化共享技术的标准制定工作。另外,加强与其他部门的合作,推动现有标准的修订和广泛推广。
人才培养方向
高等教育机构正致力于在人才培养方案中融入语言智能等跨学科课程,并特别设立“语言文字与人工智能”为核心课程。此举措旨在培育能够服务于国家关键语料库建设及相关产业的专业人才,进而推动语言文字领域的信息化进程。
未来影响展望
2027年建成的“国家关键语料库”预计将对日常和学习产生重要影响。在日常生活中,智能语音助手的功能和准确性将得到提升;在教育学习方面,辅助工具的效果也将明显增强。然而,其具体影响尚需时间的检验。您认为“国家关键语料库”在未来发展中,将主要在哪些领域引发显著的变革?