袁家宏教授开讲“基于深度学习的语音学研究”

发布者:贾倩发布时间:2023-03-08浏览次数:56

3月1日下午,由人文与社会科学学院心理学系主办的心理学前沿论坛第十期正式开讲。中国科学技术大学语言科学交叉研究中心袁家宏教授应邀做题为《基于深度学习的语音学研究》的精彩讲座。讲座通过腾讯会议同步在线分享,科大师生及科大讯飞的技术专家线下线上参加。心理学系执行主任孔燕教授致开场词,对袁家宏教授的学科背景、研究领域进行了介绍,并对相关学科师生的到来表示欢迎。

从我国现代语言学起步之初,语音学就是最能体现现代科学精神的一个分支,一直注重技术手段与传统语音分析方法相结合,发挥语音学研究的应用价值。20世纪50年代语图仪的问世、70年代计算机的应用推动语音学领域发生了两次革命。现今,大数据和深度学习技术的发展正在促进语音学的第三次革命。

袁家宏教授一直注重开展面向社会和现实需求的语音学研究。讲座中,他以音位识别、阿尔兹海默症识别和连续变调的研究为例,结合各类语音样本、分析图表、实际案例,详细地讲解了深度学习模型在这三个方面的应用与优化过程,论述了语音知识可以帮助提高端到端模型的性能以及理解和解释端到端模型的表现,和利用深度模型语音表征进行语音分析的巨大潜力,为应用与基础研究的融合发展提供了一个范例。其中,袁教授通过中国科学技术大学东区食堂疫情防控期间的语音提示这一生活案例,区分“戴好(二声)口罩”与“戴好(三声)口罩”,让现场的师生们直观地理解了“三声连续变调”及其在语言中的广泛使用,并认识到三声连续变调识别的复杂性。

袁家宏教授详实且精彩的分享让现场师生们受益匪浅,深度学习模型的迁移能力与可解释性、普通人与阿尔兹海默症患者在停顿填充词“然后”的使用上的显著性差异等话题也激起了热烈讨论。对于阿尔兹海默症患者在图片描述中很少使用“然后”一词,各位老师同袁教授从阿尔兹海默症患者脑区的认知损伤、语音数据采集过程中的不连续性、词汇的语音形式和语义功能等角度进行了分析与讨论。

近两个小时的讲座及讨论,激发了大家对基于深度学习的语音学研究的强烈兴趣及深入思考。语音学、心理语言学、脑科学、人工智能等如何交叉,如何服务于百姓的迫切需要,师生们期待下一步可以在项目申报、交叉学科探讨等方面互相借力,共同推进。

讲座最后,孔燕教授代表心理学系全体师生对袁教授的精彩讲座再次表示感谢,并赠送纪念品。

心理学前沿论坛,作为心理学系三大品牌论坛之一,旨在通过和国内外知名学者的互动,分享心理学前沿研究热点,以及心理学科在社会关切问题上的应用,积极促进具有科大特色心理学科的构建。  


(心理学系 供稿)