OpenI 启智社区

启智社区,确实给力

当前位置:首页 > 启梦行动 > 讲座沙龙 > EngineClub > 2021 > 主题分享 >

基于字形的文本表示方法

  • 发布时间:2024-05-09

2021年11月10日-第17场技术讲座

讲座题目:基于字形的文本表示方法
分享人:侯永帅博士
分享人介绍:哈尔滨工业大学计算机应用技术专业博士,现于鹏城实验室基础技术研究室,负责自然语言处理算法研发。联系邮箱:houysh@pcl.ac.cn
内容介绍:
目前针对中文的自然语言处理方法大多是以字符ID形式作为输入,通过字符的上下文来学习字符的语义表示,很少考虑中文字符的字形特性,没有很好利用汉字字形蕴含的语义信息。本次分享介绍一种基于汉字字形特征的文本表示方法以及基于该方法的预训练语言模型和翻译模型的实现。通过在9个NLU任务上对预训练语言模型的实验验证和在6个不同语种的翻译模型的实验验证,使用字形特征可有效提升模型在目标任务上的性能。

更多技术讲座和课件下载,请访问EngineClub项目地址