当前位置:首页 > 学生 > 招聘信息
招聘信息
数据工程师

8000-10000元

工作地域:北京市   职位类别:其他专业技术人员   学历要求:硕士研究生在学   招聘人数:2人
发布时间:2025-11-03

* 专业要求:

不限专业

* 职位描述:

岗位职责:

1.设计并开发端到端数据流水线,支持多模态数据(视觉、点云、关节状态、语言指令等)的采集、清洗、标注、存储及高效检索,与SaaS平台或仿真工具链集成。

2.构建自动化数据标注系统,优化标注流程质量与效率,确保数据集版本的可追溯性和一致性。

3.开发仿真数据生成工具链,基于Isaac Sim/MuJoCo等平台合成高保真机器人数据,支撑强化学习训练与Sim2Real迁移。

4.结合生成式AI增强数据多样性与逼真度,解决真实场景数据稀缺问题。

5.挖掘高价值数据特征,为算法团队提供针对性训练集,优化具身模型的性能。

6.构建数据驱动的模型评测基准,制定任务评估标准(如抓取成功率、导航精度)。

7.联动算法团队理解数据需求,协同仿真团队优化物理引擎参数,确保数据与模型训练的适配性。

8.支持硬件部署环节,提供数据质量监控方案,辅助模型在机器人端侧的实时推理优化。


岗位要求: 

1.计算机科学、人工智能、机器人、数据工程等相关专业,本科及以上学历。

2.具备机器人竞赛或开源项目(如ROS数据采集)经历,主导过量产级数据闭环项目优先。

3.熟练Python/SQL,掌握PyTorch/TensorFlow框架;熟悉大数据处理工具(Spark/Kafka)及分布式存储(HDFS/对象存储)。

4.熟练使用ROS/ROS2机器人中间件及仿真平台(Isaac Sim/Gazebo),实现多传感器数据同步。

5.掌握数据仓库设计、ETL开发、OLAP引擎应用,具备高并发微服务架构设计经验。

6.熟悉多模态数据处理技术,如时序对齐、点云配准、图像-动作联合标注。

7.深入理解具身智能技术栈:强化学习训练闭环、多模态大模型(如CoT、Diffusion Policy)、机器人运动控制基础。

8.了解Sim2Real技术瓶颈及数据增强解决方案(如域随机化、神经渲染)。