報告題目:面向低資源場景的信息抽取與知識圖譜構建
報告人:張日崇
報告時間:2022年12月28日上午10:00~11:00
報告地點:騰訊會議號447-655-756
主辦單位:計算機與軟件工程學院
報告人簡介:
張日崇,博士,北京航空航天大學教授,長期從事自然語言處理、知識工程方向的研究工作,主持或參與國家科技部重大專項、國家自然科學基金項目等項目20余項,累計發表論文100余篇,多篇文章被圖靈獎獲得者引用,擁有授權專利30余項,獲2018年電子學會技術發明一等獎。擔任中國計算機學會計算機普及工委主任助理、自然語言處理專委會委員、《Computational Intelligence》編委、長期擔任IJCAI、AAAI、ACL等人工智能、自然語言處理領域國際學術會議程序委員會高級委員、委員。
講座簡介:
目前,大規模非結構化數據已經成為知識圖譜構建的重要數據來源,作為主要工具的信息抽取模型主要借助深度學習方法實現。然而,由于深度學習模型對高質量訓練數據的需求,大規模、高質量標注訓練數據缺失的問題影響了信息抽取模型的效果,也限制了各類領域圖譜的構建能力。本次報告將分享報告人在的低資源(少量標注數據場景)下自然語言語義理解的方法,主要包括從特征增強和特征遷移的角度進行的數據混合增強、語法信息融合和跨領域遷移等系列建模方法,從而降低語義理解模型對領域標注的依賴,提升語義理解的準確性和應用范圍。