粤语语料库建设与大模型评测重点实验室在广州

 公司新闻     |      2024-11-17 12:52

 

  “当语言遇到大模型,每个国家,每个语种,要重新审视自己的文化语言战略。”重点实验室主任、广州大学教授齐佳音介绍,重点实验室将通过建立岭南文化核心语料及细分领域知识库、粤语数据资产库、粤语高质量数据集,以重点实验室为载体形成面向人工智能应用的粤语文化数据资源基础服务能力以及面向人工智能粤语服务的内容安全合规评测能力,为粤语的数据化、资源化、服务化和产业化助力。重点实验室第一期建设周期为五年。

  重点实验室设立“双首席科学家”。由中国工程院院士、中国电子信息产业集团有限公司资深首席科学家方滨兴,香港科技大学(广州)党委书记、国家语委科研机构国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授分别担任重点实验室技术首席专家与语言首席专家,承担学术指导和咨询工作,保障重点实验室学术发展方向。

  重点实验室将以广州大学为主体,依托广州大学网络空间安全学院、人文学院、新闻与传播学院,打造跨学科协同创新科研平台。以广州为基地,推动广东、香港、澳门的学术团体以及互联网企业,共建共享粤语语料数据库。