type
status
date
slug
summary
tags
category
icon
password
文本

第一周

  • 时间:2025.11.17-2025.11.21
  • 任务:机器人基础
  • 时长:8h
  • 内容:机器人基础学习与网站搭建学习
  • 笔记:
Fundamentals of Robotics
  • 问题:暂无
  • 计划:
    • 完成基础部分轨迹规划的问题
    • 完成基础部分高级数学工具学习
    • 开始进行强化学学习

第二周

  • 时间:2025.11.22-2025.11.28
  • 任务:文献阅读方法论学习与论文粗读
  • 时长:8h
  • 内容:由于本周校内课程有要求论文阅读,正好就挑选了attention is all you need来读
  • 笔记:
attention is all you need
科研小技巧汇总
  • 问题:暂无
  • 计划:
    • 完成基础部分轨迹规划的问题
    • 完成基础部分高级数学工具学习
    • 开始进行强化学学习

第三周

  • 时间:2025.11.29-2025.12.5
  • 任务:机器人基础与transformer学习
  • 时长:8h
  • 内容:完善笔记以及加深内容理解
  • 笔记:
Fundamentals of Robotics
attention is all you need
  • 问题:暂无
  • 计划:
    • 开始进行强化学学习

第四周

  • 时间:2025.12.6-2025.12.12
  • 任务:强化学习和robot learning方向论文阅读
  • 时长:12h
  • 内容:本周阅读了部分robot learning方向的论文,同时目前看完了王叔森的强化学习基础内容。
  • 笔记:
model
data
benchmark
dit
架构:将diffusion policy融合transformer,通过迭代去噪来实现动作预测 特点:一次性预测k步动作序列
来自特定任务训练真机数据
在多模态动作(既能向左也能向右的任务中表现优异)中表现优秀
act
架构:cave+transformer   特点:一次性预测k步动作序列
来自遥操作演示数据
在精细操作和需要双臂协同的任务中表现优异
openvla
架构:vlm+离散动作     引入视觉语言模型
来自开源数据集
基于大量数据训练的模型表现了比较好的泛化能力
pi0
架构:vlm+流匹配
来自开源数据集+自己采集的真机数据集
高难度的灵巧动作上表现优异
pi0.5
架构:基础pi0+协同训练
来自开源数据集+自己采集的数据集+网络视频
在完全未见过的环境中完成长任务(如收拾家务)上表现优异
Diffusion Policy Visuomotor Policy Learning via Action Diffusion
pi0
openvla
gr00t
  • 问题:暂无
  • 计划:
    • 继续进行强化学习入门

第五周

  • 时间:2025.1.2-2025.1.9
  • 任务:强化学习
  • 时长:14h
  • 内容:完成强化学习部分笔记
  • 笔记:
强化学习笔记

第六周

  • 时间:2025.1.9-2025.1.16
  • 任务:环境部署与代码阅读
  • 时长:10h
  • 内容:完成isaaclab,motrix的环境部署与模型训练推理。读代码、尝试调参
  • 笔记:
代码空间阅读