帕金森病(PD)是一种严重的神经退行性疾病,面临医生数量少、诊断不客观、随访难持续的现实难题。目前,综合评价量表(MDS-UPDRS)是临床诊断和评估PD的金标准,因此基于该量表的智能评估非常重要。为此,我们系统地提出了时空细粒度特征挖掘技术,解决了医学视频动作细粒度分析的关键挑战;在此基础上构建了PD视频智能评估系统,实现了包括握拳试验(MedIA 2022)、步态(TMM 2022)、脚趾拍地(TCSVT 2022)、从椅子上站起来(TCSVT 2022)、腿部灵活性(TNSRE 2020)、对指试验(Neurocomputing 2021)等运动任务的自动评估,最终达到了90%以上的可接受准确率,高于国内外同类工作,甚至优于传感器的评估性能。此外,我们还拓展上述核心技术,基于西多伦多痉挛性斜颈评分量表(TWSTRS)构建了颈部肌张力障碍的智能评估系统,实现了斜颈严重程度的自动评分。
胰腺癌,“癌症之王”,是最致命的癌症之一,主要归因于:1)缺乏早期预警征象和筛查/早期诊断手段,大多数患者确诊时已是晚期;2)难以在术前对预后风险因素有效评估,预后效果差;3)手术切除复杂,涉及癌和血管侵犯等问题。为此,我们致力于开发胰腺癌临床全流程(诊断和治疗)的影像信息系统,包括:
3)胰腺癌和癌周血管的自动分割,以及胰腺癌血管侵犯与可切除性分析;
目前,胰腺癌早期诊断系统已在数千患者的多中心大数据上得到了验证;预后评估系统也已实现了对TP53基因状态和淋巴结转移这两个关键因素的精确评估;自动分割模型也已经在多模态,多相位和多中心的上千患者的数据集上表现出优异的精度和泛化能力。最终目标是利用开发的医学影像信息学系统助力临床,受益胰腺癌患者。
生物医学数据分析面临着多种严峻的挑战,例如数据缺失、小样本、维数灾难等常见问题。个性化的具体临床需求意味着收集到的临床数据往往只有部分可用,导致数据缺失。由此还带来小样本问题,即包含相同数据模态和类型的样本数量总是很小。简单的删除、插值可能损失有效的鉴别信息,对后续分类产生不利影响。此外,同一模态的数据有可能维数很高,例如DNA甲基化数据的维数高达100k量级,维数灾难带来大量冗余信息,掩盖了真实的鉴别性特征。我们致力于应用图神经网络、元学习以及生物先验知识指导的特征选择等机器学习技术,提出多种创新算法,以解决上述技术性难题。
胶质母细胞瘤(Glioblastoma, GBM)是最为致命的原发性脑肿瘤,典型生存期为12-15个月。接受手术的患者约40%出现假性进展,成像特征与肿瘤进展非常相似,因此很容易误诊,从而导致不必要的和潜在有害的手术干预,加重患者病情。因此,为了促进正确的治疗,我们系统化探索了包括字典学习、对抗学习、卷积神经网络和图神经网络的方案,实现具有临床可解释性的真假进展诊断算法。结果都表明这些创新算法能够从有限的样本中学习到具有判别性的特征表示,从而为我们获得领先的真假进展诊断性能提供了坚实的基础。