Xbot社区实习记录 | xing

type

status

date

slug

summary

tags

category

icon

password

文本

第一周

时间：2025.11.17-2025.11.21

任务：机器人基础

时长：8h

内容：机器人基础学习与网站搭建学习

笔记:

Fundamentals of Robotics

问题：暂无

计划：

完成基础部分轨迹规划的问题
完成基础部分高级数学工具学习
开始进行强化学学习

第二周

时间：2025.11.22-2025.11.28

任务：文献阅读方法论学习与论文粗读

时长：8h

内容：由于本周校内课程有要求论文阅读，正好就挑选了attention is all you need来读

笔记：

attention is all you need

科研小技巧汇总

问题：暂无

计划：

完成基础部分轨迹规划的问题
完成基础部分高级数学工具学习
开始进行强化学学习

第三周

时间：2025.11.29-2025.12.5

任务：机器人基础与transformer学习

时长：8h

内容：完善笔记以及加深内容理解

笔记:

Fundamentals of Robotics

attention is all you need

问题：暂无

计划：

开始进行强化学学习

第四周

时间：2025.12.6-2025.12.12

任务：强化学习和robot learning方向论文阅读

时长：12h

内容：本周阅读了部分robot learning方向的论文，同时目前看完了王叔森的强化学习基础内容。

笔记:

ㅤ	model	data	benchmark
dit	架构：将diffusion policy融合transformer,通过迭代去噪来实现动作预测特点：一次性预测k步动作序列	来自特定任务训练真机数据	在多模态动作（既能向左也能向右的任务中表现优异）中表现优秀
act	架构：cave+transformer 特点：一次性预测k步动作序列	来自遥操作演示数据	在精细操作和需要双臂协同的任务中表现优异
openvla	架构：vlm+离散动作引入视觉语言模型	来自开源数据集	基于大量数据训练的模型表现了比较好的泛化能力
pi0	架构：vlm+流匹配	来自开源数据集+自己采集的真机数据集	高难度的灵巧动作上表现优异
pi0.5	架构：基础pi0+协同训练	来自开源数据集+自己采集的数据集+网络视频	在完全未见过的环境中完成长任务（如收拾家务）上表现优异

Diffusion Policy Visuomotor Policy Learning via Action Diffusion

问题：暂无

计划：

继续进行强化学习入门

第五周

时间：2025.1.2-2025.1.9

任务：强化学习

时长：14h

内容：完成强化学习部分笔记

笔记:

强化学习笔记

第六周

时间：2025.1.9-2025.1.16

任务：环境部署与代码阅读

时长：10h

内容：完成isaaclab，motrix的环境部署与模型训练推理。读代码、尝试调参

笔记:

代码空间阅读