8000-10000元
* 专业要求:
* 职位描述:
岗位职责:
1.设计并开发端到端数据流水线,支持多模态数据(视觉、点云、关节状态、语言指令等)的采集、清洗、标注、存储及高效检索,与SaaS平台或仿真工具链集成。
2.构建自动化数据标注系统,优化标注流程质量与效率,确保数据集版本的可追溯性和一致性。
3.开发仿真数据生成工具链,基于Isaac Sim/MuJoCo等平台合成高保真机器人数据,支撑强化学习训练与Sim2Real迁移。
4.结合生成式AI增强数据多样性与逼真度,解决真实场景数据稀缺问题。
5.挖掘高价值数据特征,为算法团队提供针对性训练集,优化具身模型的性能。
6.构建数据驱动的模型评测基准,制定任务评估标准(如抓取成功率、导航精度)。
7.联动算法团队理解数据需求,协同仿真团队优化物理引擎参数,确保数据与模型训练的适配性。
8.支持硬件部署环节,提供数据质量监控方案,辅助模型在机器人端侧的实时推理优化。
岗位要求:
1.计算机科学、人工智能、机器人、数据工程等相关专业,本科及以上学历。
2.具备机器人竞赛或开源项目(如ROS数据采集)经历,主导过量产级数据闭环项目优先。
3.熟练Python/SQL,掌握PyTorch/TensorFlow框架;熟悉大数据处理工具(Spark/Kafka)及分布式存储(HDFS/对象存储)。
4.熟练使用ROS/ROS2机器人中间件及仿真平台(Isaac Sim/Gazebo),实现多传感器数据同步。
5.掌握数据仓库设计、ETL开发、OLAP引擎应用,具备高并发微服务架构设计经验。
6.熟悉多模态数据处理技术,如时序对齐、点云配准、图像-动作联合标注。
7.深入理解具身智能技术栈:强化学习训练闭环、多模态大模型(如CoT、Diffusion Policy)、机器人运动控制基础。
8.了解Sim2Real技术瓶颈及数据增强解决方案(如域随机化、神经渲染)。







北京晟世天安科技有限公司
招聘信息