中央成果 | “汉语句法语义分析及其应用”项目成果介绍

时间:2023-02-20 20:27:55 阅读:

今日,我们推送《中文句法语义分析及其应用》项目成果。人工智能发展迅速,语言智能是人工智能的重要研究方向,中文句法语义分析是语言智能的核心技术,对推动语言智能的研究与应用有至关重要的作用。项目组建设开发了中文句法语义分析平台,该平台用于进行句法语义分析器的知识管理和基于网络的协同开发。中文句法语义分析平台-演示视频...

介绍

自2016年成立以来,语言资源高精尖创新中心(以下简称“中心”)已走过近五年的建设发展历程,2021年4月将迎来五年建设终评。五年来,中心已签约在研项目23个,重点建设“语言资源库”、“语言文化馆”、“‘语言传播’智能服务”三大项目,取得多项成果成果丰硕,包括语言数据库18个(套)、应用系统11个。 其中,18个语言数据库(套)包括:世界语言基础信息库、“一带一路”沿线国家语言文化核心资源集、中国周边国家(6国)语言资源集、世界语言语言识别资源集、华侨资源库、俄汉大规模词汇和句对库、汉阿语言资源合集、汉俄日韩英对齐4000词库、大规模汉语语料库句法分析、国际汉语教育优质学习资源合集、全球汉语中介语语料库、智能语音教学汉语中介语音库、中俄经贸合作信息库及双语合同文本库、冬奥会多语言术语资源数据库,面向冬奥会的机器翻译资源大 tabase、大型冬奥项目知识图谱资源集、中国经典诗词资源集、国学研究文献库和人才库等。中心开发的应用系统包括:冬奥术语库系统、冬奥机器翻译系统、智能冬奥问答原型系统、中俄商务交流系统、海外华人资源系统、SAIT中文智能语音教学系统、“文心”智能作文批改系统、全球语言文化资源采集展示系统、在线查询系统疫情防控外语指南等。自2020年12月17日起在线智能英语句子分析器,本公众号将推出“中心成果”系列文章,陆续介绍中心各项目的资源和体系成果。 今天,我们发布了“汉语句法语义分析及其应用”项目的成果。

在线读英语朗读器免费_在线智能英语句子分析器_在线读英语打分器

项目介绍

“汉语句法语义分析及其应用”项目由北京语言大学语言资源高精尖创新中心特聘研究员荀恩东教授主持。 该项目于2017年4月启动,将于2020年9月竣工。

人工智能发展迅速,语言智能是人工智能的一个重要研究方向。 汉语句法语义分析是语言智能的核心技术,对语言智能的研究和应用具有至关重要的推动作用。 目前英语培训,句法语义分析在英语等印欧语言中取得了不错的表现。 然而,由于中文缺乏正式标记,具有中文语义和流畅句子的特点,这使得计算机缺乏足够的特征来捕捉上下文信息。 中国在这方面一直没有实质性的突破。

本项目以汉语句法语义分析为核心技术研发目标,搭建研发软件平台,获取分析器所需的多层次语言知识在线智能英语句子分析器,并构建相应的知识库:包括词典知识、规则知识、语块知识、汉语动词论元知识等,探索以知识为导向,充分利用大数据和深度学习方法的汉语句法语义分析新方法。

项目成果

标准规范

为实现构建大规模汉语句法语义资源的目标,本项目制定了《语篇句子成分标注标准》和《块相关语篇标注标准》。 在这两个基本标注规范的指导下,项目组实现了句式结构和“块依赖”资源的大规模构建。

资源成果

课题组的主要理论研究成果为“易和图”中文语义表示框架。 汉语句法语义分析是一项语言工程,需要良好的可计算性和高度的形式化。 课题组充分关注汉语的特点在线智能英语句子分析器中央成果 | “汉语句法语义分析及其应用”项目成果介绍,广泛借鉴各种先进的语言学理论和计算理论,总结出新的理论框架,提出了以“积分图”为表征形式、以“块依赖”为表征的理论。核。 在信息处理任务中取得实效。

“意图图”是指针对应用场景的语义表示图,是单根的有向图。 图中的节点对应承载语义概念的语言单元,边是连接两个节点单元的语义关系。 “共识图”的生成基于“区块依赖”。 “块依赖”是指以块为基本单位建立块与块之间语义关系的策略和算法。

在线读英语打分器_在线智能英语句子分析器_在线读英语朗读器免费

在线读英语打分器_在线读英语朗读器免费_在线智能英语句子分析器

同意地图示例

“共识图”的构建基于“块依赖”语法。 在“集成图谱”的表示形式上英语,充分借鉴知识事务图谱三元组的形式英语培训,同时集成复杂特征集的表达形式,使“集成图”的语义表示形式灵活在线智能英语句子分析器,语义内容完整。 课题组开展了大规模、深层次的汉语句法语义分析的多粒度语言知识项目。

1.“集成地图”的标注。 为验证提出的中文句法语义“集成图”的合理性,为后续工作提供验证数据,项目组启动了中文“集成图”标注项目。 目前,已定制“易和图”标注规范和辅助标注软件,已标注“易和图”约10000句。

2. 汉语动词的结构内标记。 对于多字汉语动词,给出了内部结构标注,如结构类型、核心词、是否可以单独使用等。标注动词约20000个词,该工作已完成。

3.中文“块依赖”结构注释。 对于汉语句子,区分句法成分块、句间衔接块和助块,通过块的顺序呈现句子的基本骨架。 注释了大约 600,000 个条款。

4.中文搭配标签。 对中文大数据中块的搭配现象进行了大规模调查,形成了高质量的搭配库,实例规模超过900万。

技术成果

项目组搭建并开发了中文句法语义分析平台,用于句法语义分析器的知识管理和基于网络的协同开发。 句法语义分析器是平台的核心组件,平台为分析器的高效运行和功能提供支持。 目前,该平台的主要功能已经开发完成。 其中,句法语义分析器实现的核心功能包括:

1、词法模块:采用不同的方法设计了三种词法分析器,分别具有中文分词、词性标注和命名实体识别功能。

2.边界模型:设计10元文法的中文边界模型,并利用该模型完成二叉树的生成。

3.设计块依赖分析模型,用于实现基于词分析和边界识别结果的块依赖识别。

中文句法语义分析平台-演示视频

猜你喜欢

发表评论

评论列表