关于机器学习的三个阶段
705
2022-05-30
文档参考来源:https://acutronicrobotics.com/docs/
友情提示:如果您是2019年接触机器人操作系统ROS,可以忽略ROS1.0时代的教程,直接学习ROS2.0。
技术更新迭代速度是非常快的,工具如此,算法也是如此,就如同如今很少有人会选择购买功能机(对比智能机)一样。
某些功能可能无法用于某些模块。有关更多信息,请参阅每个模块的文档(例如模块化机器人关节)
第1级:开发人员
面向开发人员的API,由ROS 2.0提供支持,构建于机器人的标准化信息模型之上,硬件机器人信息模型(HRIM)可确保制造商之间的互操作性。H-ROS API Level 1由4个元素组成:
ROS2接口
可视化
仿真模拟
命令行界面(CLI)
ROS 2.0 API
机器人操作系统(ROS)是一组软件库和工具,可帮助您构建机器人应用程序。H-ROS提供了一组主题,服务,操作和参数,仅关注应用程序。HRIM以ROS为基础,是机器人的信息模型,可促进不同机器人硬件供应商之间的互操作性。它提供通用接口,简化了可重配置性和灵活性,是机器人行业强烈要求的创新。
可视化
RVIZ2是一个ROS 2.0图形界面,允许您使用多种可用主题的插件可视化大量信息。
仿真模拟
机器人模拟是每个机器人工具箱中必不可少的工具。精心设计的模拟器可以快速测试算法,设计机器人,并使用真实场景执行回归测试。Gazebo能够在复杂的室内和室外环境中准确有效地模拟机器人群。触手可及的是强大的物理引擎,高质量的图形以及便捷的编程和图形界面。最重要的是,Gazebo是一个充满活力的社区。
命令行界面(CLI)
此CLI将与每个H-ROS模块中提供的API进行通信。此CLI将允许配置与我们的H-ROS SoM相关的一些基本方面。
获取SoM的实际信息(版本,主机名......)
启动/停止正在运行的生命周期
获取并设置RMW_IMPLEMENTATION正在运行
获取并设置ROS_DOMAIN_ID正在运行
模块化接头具体:
将实际位置设置为零
第2级:研究人员
针对有兴趣研究机器学习如何赋予机器人额外功能的研究人员。该层提供了多种技术(主要用于强化学习和监督学习),这些技术建立在由TensorFlow提供支持的顶级基本原语之上。所有这些技术都与可与ROS互操作的底层连接。机器人专家对AI的态度。
在本文档的这一部分中,我们将描述将增强学习(RL)算法以及相关的ROS 2和Gazebo包合并在一起的整体集成工作。开发的框架是gym_gazebo2,这是一个结合了两全其美的工具包:符合最先进的RL算法和所有必要的机器人工具,如用于运动学和控制的各种ROS 2包。为了监控培训的进展,我们利用已经提到的Gazebo模拟器。
所有基于gym-gazebo2环境的实验都可以在ROS2Learn中找到,这是我们应用于机器人技术的最先进的算法集合。
我们还将介绍一些我们使用开源工具测试的模块化机器人的不同DRL技术。
算法
ROS2Learn
gym_gazebo2
第3级:用户
面向用户的这一层旨在提供一套简单而完整的功能,以方便机器人的使用。我们研究如何使用AI来增强传统的路径规划技术以及机器人如何通过模仿来学习特定的任务。
模仿学习(IL)
https://github.com/AcutronicRobotics/gym-gazebo2
gym-gazebo2 is a toolkit for developing and comparing reinforcement learning algorithms using ROS 2 and Gazebo. Built as an extension of gym-gazebo, gym-gazebo2 has been redesigned with community feedback and adopts now a standalone architecture while mantaining the core concepts of previous work inspired originally by the OpenAI gym.
This work presents an upgraded, real world application oriented version of gym-gazebo, the Robot Operating System (ROS) and Gazebo based Reinforcement Learning (RL) toolkit, which complies with OpenAI Gym. A whitepaper about this work is available at https://arxiv.org/abs/1903.06278. Please use the following BibTex entry to cite our work:
@misc{1903.06278,
Author = {Nestor Gonzalez Lopez and Yue Leire Erro Nuin and Elias Barba Moral and Lander Usategui San Juan and Alejandro Solano Rueda and Víctor Mayoral Vilches and Risto Kojcev},
Title = {gym-gazebo2, a toolkit for reinforcement learning using ROS 2 and Gazebo},
Year = {2019},
Eprint = {arXiv:1903.06278},
}
A whitepaper regarding previous work of gym-gazebo is available at https://arxiv.org/abs/1608.05742.
gym-gazebo2 is a complex piece of software for roboticists that puts together simulation tools, robot middlewares (ROS, ROS 2), machine learning and reinforcement learning techniques. All together to create an environment where to benchmark and develop behaviors with robots. Setting up gym-gazebo2 appropriately requires relevant familiarity with these tools.
Docs. In-depth explanations and actively growing tutorials can be found at https://acutronicrobotics.com/docs. The following is an example of what you can achieve using gym-gazebo2 as a submodule of ros2learn repository. The goal is to reach the green target.
Left image shows the start of a training
To the right we execute an already trained policy.
https://github.com/AcutronicRobotics/ros2learn
This repository contains a number of ROS and ROS 2 enabled Artificial Intelligence (AI) and Reinforcement Learning (RL) algorithms that run in selected environments.
The repository contains the following:
algorithms: techniques used for training and teaching robots.
environments: pre-built environments of interest to train selected robots.
experiments: experiments and examples of the different utilities that this repository provides.
A whitepaper about this work is available at https://arxiv.org/abs/1903.06282. Please use the following BibTex entry to cite our work:
@misc{1903.06282,
Author = {Yue Leire Erro Nuin and Nestor Gonzalez Lopez and Elias Barba Moral and Lander Usategui San Juan and Alejandro Solano Rueda and Víctor Mayoral Vilches and Risto Kojcev},
Title = {ROS2Learn: a reinforcement learning framework for ROS 2},
Year = {2019},
Eprint = {arXiv:1903.06282},
}
AI API TensorFlow 机器人
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。