type
status
date
slug
summary
tags
category
icon
password
文本
第一周
- 时间:2025.11.17-2025.11.21
- 任务:机器人基础
- 时长:8h
- 内容:机器人基础学习与网站搭建学习
- 笔记:
- 问题:暂无
- 计划:
- 完成基础部分轨迹规划的问题
- 完成基础部分高级数学工具学习
- 开始进行强化学学习
第二周
- 时间:2025.11.22-2025.11.28
- 任务:文献阅读方法论学习与论文粗读
- 时长:8h
- 内容:由于本周校内课程有要求论文阅读,正好就挑选了attention is all you need来读
- 笔记:
- 问题:暂无
- 计划:
- 完成基础部分轨迹规划的问题
- 完成基础部分高级数学工具学习
- 开始进行强化学学习
第三周
- 时间:2025.11.29-2025.12.5
- 任务:机器人基础与transformer学习
- 时长:8h
- 内容:完善笔记以及加深内容理解
- 笔记:
- 问题:暂无
- 计划:
- 开始进行强化学学习
第四周
- 时间:2025.12.6-2025.12.12
- 任务:强化学习和robot learning方向论文阅读
- 时长:12h
- 内容:本周阅读了部分robot learning方向的论文,同时目前看完了王叔森的强化学习基础内容。
- 笔记:
ㅤ | model | data | benchmark |
dit | 架构:将diffusion policy融合transformer,通过迭代去噪来实现动作预测 特点:一次性预测k步动作序列 | 来自特定任务训练真机数据 | 在多模态动作(既能向左也能向右的任务中表现优异)中表现优秀 |
act | 架构:cave+transformer 特点:一次性预测k步动作序列 | 来自遥操作演示数据 | 在精细操作和需要双臂协同的任务中表现优异 |
openvla | 架构:vlm+离散动作 引入视觉语言模型 | 来自开源数据集 | 基于大量数据训练的模型表现了比较好的泛化能力 |
pi0 | 架构:vlm+流匹配 | 来自开源数据集+自己采集的真机数据集 | 高难度的灵巧动作上表现优异 |
pi0.5 | 架构:基础pi0+协同训练 | 来自开源数据集+自己采集的数据集+网络视频 | 在完全未见过的环境中完成长任务(如收拾家务)上表现优异 |
- 问题:暂无
- 计划:
- 继续进行强化学习入门
第五周
- 时间:2025.1.2-2025.1.9
- 任务:强化学习
- 时长:14h
- 内容:完成强化学习部分笔记
- 笔记:
第六周
- 时间:2025.1.9-2025.1.16
- 任务:环境部署与代码阅读
- 时长:10h
- 内容:完成isaaclab,motrix的环境部署与模型训练推理。读代码、尝试调参
- 笔记: