本项目建立在计算机图形学和计算机视觉领域的已有成果基础上,包括扩散模型、三维渲染等。团队成员拥有相关的计算机视觉、图形学以及数学等背景,具有丰富的研究和开发经验。项目所需的软硬件设备已经具备,包括计算机、图形处理器、数据存储设备以及数据采集设备等。此外,本项目得到了相关领域的专家和教授的支持和指导,具备充足的人员和场地支持。因此,本项目具备了充足的技术基础和支持条件,可以高效地进行研究和开发工作。
指导教师将提供专业的理论及工程实践指导,以及项目所需的硬件包括GPU计算资源、实验场地以及配套软件。
本项目旨在开发一种结合三维场景和三维人体模型的数据集生成方法,以创造出适应性强的“行人”数据集,专用于提升ReID(Re-identification,重新识别)系统的性能。项目的主要目标包括:
1. 开发三维行人模型:利用先进的三维建模技术,结合真实世界的行人特征,生成具有多样外观和姿态的三维行人模型。
2. 三维场景集成:构建多种真实世界场景的三维数字化表示,如城市街道、商场、公园等,以模拟行人在各种环境中的表现。
3. 隐私保护:生成的数据集将完全基于虚拟模型,以避免使用真实个人数据,确保隐私保护。
4. 快速迁移学习:通过模拟真实世界的复杂性,提供用于训练ReID系统的高质量数据,支持快速迁移学习和原型制作。
预期成果:
生成一个高质量的三维行人数据集,用于训练和提升ReID系统的识别能力。
时间安排:
l 2024年4月至2024年7月: 技术预研和三维模型开发。
l 2024年8月至2024年11月: 三维场景的建设和数据集的初步生成。
l 2024年12月至2025年3月: 测试和优化数据集,进行ReID系统的训练和评估。
l 2025年4月: 完成项目,撰写结题报告,准备成果展示。