目前抑郁症已成为严重的全球性卫生问题,全球有近3亿人罹患抑郁症,近十年来患者增速约18%,它已经成为人类的第二杀手,仅次于癌症。2019年发表的中国精神卫生调查显示,成人抑郁症终身患病率高达到3.4%。但抑郁症是一种异质性综合征,以临床症状评估为抑郁症诊断的关键指标并不稳定。困难聚焦在对其发病机制、客观诊断标记和高效治疗这三个重要的临床科学问题的深层求解上。已有多家研究机构联合构建涵盖多个学科层面的综合数据库,为抑郁症的研究提供了重要的信息资源,但针对这种大规模多源异构数据,建模还处于探索阶段,还没有通用且被广泛认可的分析工具,这严重阻碍了对抑郁症病理生理机制的深入研究。本项目组一直致力于开发临床级别的人工智能辅助诊疗评估的系统,着力实现大数据数理科学、多模态信息处理技术、临床疾病智能诊断的三方闭环互通。为此,基于全维度多源异构数据,我们拟提出一种多任务稀疏学习网络框架,开展联合学习,利用时空图神经网络挖掘多类数据之间的重要性、互解释性、互补性,利用张量计算建立任意维度变量间的融合机制,同时使网络轻量化。进一步建立挖掘抑郁症发病机制的因果分析系统,获取客观明确的疾病的量化指标、 解析遗传、行为、生理与疾病的相关关系。经过大规模多中心的独立验证,这种具有共享特性的临床级AI辅助诊疗系统有望获得良好的可解释、鲁棒性和泛化能力,有潜力成为一种抑郁症诊断的通用工具。
课题目标:
一. 学习和掌握生物医学大数据清洗与特征表示技术
1. 数据清洗技术
2. 数据预处理
a) 数据结构化; b) 文本变量处理; c) 缺失值处理
3. 特征筛选
a) 离散型变量特征筛选;b) 连续性变量特征筛选
二. 学习和掌握基于多源异构数据的医学人工智能系统的构建和训练
1. 非结构化数据处理子模块
a) 功能网络:图论学习、图卷积神经网络的构建;b) 形态学特征提
取:多尺度图像特征表示网络的建立。
2. 结构化数据处理子模块
a) LSTM; b) 注意力机制时间序列的Encoder-Decoder体系结构建立
3. Hybrid Model
a)
多种神经网络模型的结合; b) 多种数据类型融合;c) 多维时间
序列数据挖掘中的相似性度量方法的掌握。