datamonday

【EAI 006】ChatGPT for Robotics：将 ChatGPT 应用于机器人任务的提示词工程研究

论文标题：ChatGPT for Robotics: Design Principles and Model Abilities
论文作者：Sai Vemprala, Rogerio Bonatti, Arthur Bucker, Ashish Kapoor
作者单位：Scaled Foundations, Microsoft Autonomous Systems and Robotics Research
论文原文：https://arxiv.org/abs/2306.17582
论文出处：TMLR
论文被引：148（01/05/2024）
论文代码：https://github.com/microsoft/PromptCraft-Robotics，1.6k star
项目主页：http://aka.ms/ChatGPT-Robotics

Abstract

本文介绍了一项关于将 OpenAI 的 ChatGPT [1] 用于机器人应用的实验研究。我们概述了一种策略，该策略结合了提示工程的设计原则和高级函数库的创建，使 ChatGPT 能够适应不同的机器人任务，模拟器和外形因素（form factors）。我们重点评估了不同提示工程技术和对话策略在执行各类机器人任务时的有效性。除了使用特定任务的提示功能和通过对话进行闭环推理之外，我们还探索了 ChatGPT 使用自由形式对话，解析 XML 标记和合成代码的能力。我们的研究涵盖了机器人领域的一系列任务，从基本的逻辑，几何和数学推理一直到复杂的领域，如空中导航，操纵和具身Agent。我们的研究表明，ChatGPT 可以有效地解决其中几项任务，同时允许用户主要通过自然语言指令与之交互。除了这些研究之外，我们还介绍了一个名为 PromptCraft 的开源研究工具，其中包含一个平台，研究人员可以通过该平台合作上传并投票选出机器人应用中的优秀提示方案示例，以及一个集成了 ChatGPT 的机器人模拟器示例，使用户更容易开始将 ChatGPT 用于机器人。

1. Introduction

自然语言处理（NLP）技术的飞速发展带动了大型语言模型（LLM）的发展，如 BERT [2]，GPT-3 [3] 和 Codex [4]，它们正在为广泛的应用带来变革。这些模型在文本生成，机器翻译和代码合成等各种任务中取得了令人瞩目的成果。OpenAI ChatGPT [1]是这一系列模型中的最新成员，它是一个预训练的文本生成模型，并通过人类反馈进行了微调。与之前主要在单一提示下运行的模型不同，ChatGPT 通过对话提供了特别令人印象深刻的交互技能，将文本生成与代码合成相结合。我们在本文中的目标是研究 ChatGPT 的能力能否以及如何推广到机器人领域。

与纯文字应用不同，机器人系统需要深入了解现实世界的物理学，环境背景以及执行物理动作的能力。生成式机器人模型需要具备强大的常识性知识和复杂的世界模型，并能与用户互动，以物理上可行且在现实世界中合理的方式解释和执行命令。这些挑战超出了语言模型的原有范围，因为它们不仅要理解给定文本的含义，还要将意图转化为符合逻辑顺序的物理动作。

近年来，人们一直在尝试将语言融入机器人系统。这些努力主要集中在使用语言标记嵌入模型，LLM 特征和多模式模型特征，以适应特定的形式因素或场景。应用范围包括：

视觉语言导航[5, 6]
基于语言的人机交互[7, 8]
视觉语言操纵控制[9, 10, 11]

然而，尽管在机器人技术中使用 LLMs 具有潜在的优势，但大多数现有方法都受到了严格的范围和有限的函数集（limited set of functionalities）的限制，或者由于其开环性质，无法进行流畅的交互，也无法根据用户反馈修正行为。

GPT-3，LaMDA 和 Codex 等模型也显示了在零样本机器人场景中执行高级Agent规划 [12, 13] 或代码生成 [14, 15] 任务的前景。这些早期演示启发我们研究 ChatGPT，将其作为机器人领域一种潜在的多功能工具，因为它结合了自然语言和代码生成模型的优势以及对话的灵活性。ChatGPT 能够进行自由形式的对话并捕捉长时间的上下文，因此用户能以更自然的方式与模型进行交互，并能灵活地纠正行为。

本文旨在展示 ChatGPT 在机器人应用方面的潜力。我们概述了利用 ChatGPT 解决机器人应用问题的一个关键概念，即创建一个高级函数库。鉴于机器人技术是一个多样化的领域，存在多种平台，应用场景和工具，因此有各种各样的库和API。我们没有要求 LLM 输出特定于平台或库的代码，这可能会涉及大量的微调，相反，我们创建了一个简单的高级函数库供 ChatGPT 处理，然后可以在后端链接到所选平台的实际 API。因此，我们允许 ChatGPT 从自然对话中解析用户意图，并将其转换为高级函数调用的逻辑链。我们还概述了几条有助于 ChatGPT 解决机器人任务的提示性工程指南。

我们的研究表明，ChatGPT 能够以零样本的方式解决各种与机器人相关的任务，同时适应多种外形因素，并允许通过对话进行闭环推理（closed-loop reasoning）。此外，我们还旨在展示当前模型的局限性，并就如何克服这些局限性提出想法。我们的主要贡献如下：

我们展示了将 ChatGPT 应用于机器人任务的流程。该流程涉及多种提示技术，如自由形式的自然语言对话，代码提示，XML 标记和闭环推理。我们还展示了用户如何利用高级函数库，让模型快速解析人类意图并生成解决问题的代码；
我们通过实验评估了 ChatGPT 执行各种机器人任务的能力。我们展示了该模型在解决数学，逻辑和几何运算时的能力和局限性，然后探索了涉及具身Agent，空中导航和操纵的更复杂场景。我们还包括 ChatGPT 计划的模拟和实际实验；
我们推出了一个协作式开源平台 PromptCraft，研究人员可以在该平台上合作，提供在机器人环境中使用 LLM 时积极（和消极）提示策略的示例。提示工程主要是一门经验科学，我们希望为研究人员提供一个简单的界面，让他们作为一个社区贡献知识。随着时间的推移，我们的目标是提供不同的环境，让用户可以测试他们的提示，并欢迎新的贡献；
我们发布了一款基于微软 AirSim [16] 并与 ChatGPT 集成的模拟工具。AirSim-ChatGPT 仿真包含一个无人机导航环境示例，旨在为研究人员探索 ChatGPT 如何实现机器人应用场景提供一个起点。

我们希望通过这项工作，为未来将 LLM 与机器人技术相结合的研究开辟新的机遇和途径。我们相信，我们的研究成果将激励和指导这一激动人心的领域的进一步研究，为开发能够以自然，直观的方式与人类互动的新型，创新机器人系统铺平道路。欲了解更多详情，我们鼓励读者在项目网页上观看我们的详细实验视频：https://aka.ms/ChatGPT-robotics。

2. Robotics with ChatGPT

在机器人控制中提示 LLMs 会带来一些挑战，例如提供完整准确的问题描述，确定正确的允许函数调用和 API 集，以及用特殊参数调整答案结构。为了在机器人应用中有效利用 ChatGPT，我们构建了一个由以下步骤组成的流水线：

首先，我们定义一个高级机器人函数库。
接下来，我们为 ChatGPT 创建一个提示，在描述目标的同时，确定库中允许使用的高级函数集。提示中还可以包含约束信息，或 ChatGPT 应如何构建其响应结构的信息。
用户可以通过直接分析或模拟的方式，继续循环评估 ChatGPT 输出的代码，并就输出代码的质量和安全性向 ChatGPT 提供反馈。
在对 ChatGPT 生成的实现进行迭代后，可将最终代码部署到机器人上。

图 2 以家用机器人为例，形象地描述了这一流程。

2.1. Construction and description of the robotics API library

机器人技术是一个成熟的领域，目前已有大量黑盒或开源库，可用于感知和动作领域的基本功能（如物体检测和分割，映射，运动规划，控制和抓取）。如果在提示中正确指定，LLM 就能使用这些预定义的函数进行机器人推理和执行。

一个重要的提示设计要求是，所有API的名称必须能够描述整体功能行为。要让 LLM 能够推理出 API 之间的功能联系，并为问题生成所需的结果，明确的名称是必不可少的。因此，我们可以定义高级函数，将其作为各自库中实际实现的封装器。例如，名为 detect_object(object_name) 的函数可以内部链接到 OpenCV 函数或计算机视觉模型，而类似 move_to(x,y,z) 的函数则可以内部调用运动规划和避障管道以及无人机的相应底层电机指令。在提示中列出这样一组高级函数，对于 ChatGPT 创建行为基元的逻辑序列，以及泛化到不同场景和平台至关重要。

根据具体情况，我们建议解释API的功能，并在必要时将其分解为具有明确输入和输出的子组件，类似于代码文档。在图 3 中，我们以家庭烹饪机器人为例，介绍了一种良好的 API 提示策略。该策略允许 ChatGPT 根据机器人实际能够执行的函数来推理任务的顺序和内容。感兴趣的读者参阅附录 A.1，以了解 ChatGPT 在未提供 API 指导时如何进行推理，这将导致基于文本的无限制回答；或参阅附录 A.2，以了解 API 不够清晰时的情况，这将导致对函数调用参数产生幻觉。

我们注意到，经典的符号人工智能结构脆弱，需要在物体和函数之间预先定义严格的关系，而 LLM 与之不同，当与特定问题相关时，它能够完全定义新的函数和概念。在处理机器人应用时，这种能力赋予了 LLM 灵活性和稳健性。图 4 显示了 ChatGPT 如何在需要解决问题时创建新的高级概念，甚至低级代码，甚至融合现有的API。环路上的用户可以将这种能力作为一种设计策略加以利用，当目前的API不足以解决手头的任务时，可以在 LLM 的帮助下反复定义新的API。

2.2. Clear description of the task details in the prompt

通过对所需机器人任务及其上下文进行简明扼要的描述，ChatGPT 可以生成更准确的回复。除了机器人API外，一个好的上下文描述还应包含以下内容：

限制和要求：指定与任务相关的限制或要求。如果任务涉及移动物体，可以指定要移动的物体的重量，大小和形状。
环境：描述机器人任务所处的环境。例如，如果任务是在迷宫中导航，可以描述迷宫的大小和形状，以及需要避开的任何障碍或危险。
当前状态：描述机器人系统的当前状态。例如，如果任务是拾取一个物体，可以描述机器人和物体的当前位置和方向。
目标和目的：说明任务的目标和目的。如果任务是组装拼图，可以说明需要组装的拼图块数和预期完成时间。
解决方案示例：演示如何解决类似任务，以此指导 LLM 的解决策略。例如，如果任务涉及与用户的互动，我们可以举例说明机器人应如何以及何时询问用户的输入（见图 5）。需要注意的是，引子也会带来偏差，因此我们应该提供多种多样的示例，避免使用规定性过强的语言。

即使是精心设计的提示也可能不包含解决问题所需的所有必要信息，或者在某些情况下 ChatGPT 无法以 zero-shot 的方式生成正确的回复。在这种情况下，我们发现用户可以采取一种简单而有效的策略，那就是以聊天格式向 ChatGPT 发送描述问题的额外指令，让它自行纠正。以往依赖 GPT-3 或 Codex 模型 [15, 14] 的方法需要用户重新设计输入提示，并从头开始生成新的输出。然而，ChatGPT 的对话能力是一种令人惊讶的有效行为纠正工具。第 3.2 节和补充视频展示了用户与 ChatGPT 之间的交互行为示例。

2.3. Special arguments to bias the answer’s structure

不同的提示方法可以用来强制模型的输出服从某种特定的模式。例如，用户可能希望自动解析 ChatGPT 的输出，以便将其用于其他脚本的实时执行。如图 3 所示，一种简单的策略是直接要求 ChatGPT 生成特定语言（如 Python，C++）的代码。接下来通常是一段自由格式的文本，然后是一个代码块。如图 5 所示，通过要求模型使用 XML 标记来帮助我们自动解析输出，可以生成更有条理的响应。

在其他情况下，用户可能希望强制模型按照列表模式而不是代码或自由格式文本输出答案。附录 A.3 展示了这种方法的一个示例，其中用户提示的最后一行指示模型的输出。

3. ChatGPT abilities for solving robotics problems

本节将深入探讨 ChatGPT 解决机器人问题的能力。具体来说，我们研究了 ChatGPT 在处理各种机器人相关任务时的表现，从简单的时空推理问题一直到真实世界的空中Agent和操纵部署。我们强调了在这些实验中观察到的几个有趣的功能。

虽然 ChatGPT 的功能令人印象深刻，但实际部署中的安全考虑也不容忽视，尤其是在物理机器人部署的情况下。如图 2 所示，我们发现在 ChatGPT 出现意外行为时，有必要派人进行监控和干预。此外，在现实世界中部署之前，使用模拟器对评估模型性能也特别有帮助。我们强调，在机器人技术中使用 ChatGPT 并不是一个完全自动化的过程，而是一种增强人类能力的工具。

我们在附录 B 中提供了本节问题的所有初始提示。为简洁起见，我们只摘录了每个任务的简要内容。完整对话可在以下资源库中找到：https://github.com/microsoft/PromptCraft-Robotics。

3.1. Zero-shot task planning

首先，我们注意到，ChatGPT 能够以 "0-shot "的方式解决多个机器人任务，只需访问提示和函数库说明，而无需实际代码示例。

3.1.1. Spatio-temporal reasoning: catching a basketball with visual servoing

在这个示例中，我们要求 ChatGPT 控制一个装有向上摄像头的平面机器人。机器人要根据篮球的外观，使用视觉伺服方法接住篮球。我们看到，ChatGPT 能够恰当地使用所提供的 API 函数，推理出球的外观并调用相关的 OpenCV 函数，并根据比例控制器来控制机器人的速度。更令人印象深刻的是，ChatGPT 可以使用 SVG 代码估算摄像机图像中球和天空的外观。这种行为暗示了一种可能性，即 LLM 跟踪的隐式世界模型超越了基于文本的概率。

3.1.2. Aerial robotics: real-world drone flight with intuitive human-robot interface (Click for video)

我们还使用 ChatGPT 和不同的API来控制一架真正的无人机。ChatGPT 在用户和机器人之间提供了一个极其直观的自然语言界面，可以根据模棱两可，定义不清的指令编写机器人代码，并在必要时提出澄清问题。该模型还能仅根据提示的基础API编写复杂的代码结构，用于无人机导航（环形和割草机检查）。

3.1.3. Aerial robotics: AirSim industrial inspection (Click for video)

我们还将 ChatGPT 应用于微软 AirSim [16] 模拟器的模拟领域。我们探索了由非技术用户指挥模型控制无人机并执行工业检查的想法。我们从下面的摘录中观察到，ChatGPT 能够有效地解析用户输入的意图和几何线索，并准确地控制无人机。

3.2. User on the loop: interactive conversations for complex tasks

下一步，我们重点研究了 ChatGPT 在用户提供文字反馈的情况下执行更复杂任务的能力。我们注意到，这种交互模式允许进行复杂的构造，例如课程学习，在课程学习中，系统将学习较小范围的技能，这些技能可以组合成更大，更复杂的任务。此外，我们还发现 ChatGPT 能够接收有关生成代码或其性能的高级文本反馈，并将其映射到所需的低层次代码更改中，从而使潜在的非技术用户能够轻松地与之互动。

3.2.1. Manipulation with curriculum learning (Click for video)

作为第一个例子，我们使用机械臂设置了一个积木排列任务，并为此设计了一套课程。我们要求 ChatGPT 学习拾取物体和放置物体的简单技能。随后，当被要求使用这些技能来完成更复杂的积木排列任务时，ChatGPT 会将这些学到的技能逻辑地串联起来。此外，在用木块拼出微软徽标的任务中，该模型还展示了在文字和物理领域之间架起桥梁的可概括性的精彩实例。这项任务需要记忆公司徽标的外观（包括颜色），然后将徽标抽象为物理部分，并通过现有的机器人动作进行构建。

3.2.2. Aerial robotics: AirSim obstacle avoidance (Click for video)

我们委托 ChatGPT 为一架配备了前向距离传感器的无人机编写一个具有避障功能的目标搜索算法。ChatGPT 构建了避障算法的大部分关键构件，但在无人机的方位问题上，还需要一些人工反馈。虽然反馈完全是以高级文本的形式提供的，但 ChatGPT 还是在适当的地方对代码进行了局部修改，从而改进了其解决方案。

3.3. Perception-action loops

我们还对 ChatGPT 感知-行动循环的推理能力进行了评估。首先，我们概述了该模型利用 API 库在代码输出中构建感知-动作循环的能力。该模型正确使用了图像采集和物体检测等感知功能，以提取机器人导航和控制的相关信息。

在复杂性的第二个层面，我们试图回答 ChatGPT 的对话系统本身是否可以作为一个封闭的反馈感知-行动环路的问题。我们探索了通过文本对话向模型持续提供感知信息的想法，在对话过程中，我们向 ChatGPT 输入观察结果（转换成文本格式）。我们发现 ChatGPT 能够解析这些观察信息流并输出相关行动。

3.3.1. Embodied agent: closed loop object navigation with API library (Click for video)

我们让 ChatGPT 访问计算机视觉模型，作为其功能库的一部分，并要求它探索未知环境并导航至用户指定的物体。物体检测API（后端为 YOLOv8 [17]）会返回边界框，而 ChatGPT 会生成代码来估算物体的相对角度并导航至物体。当我们向 ChatGPT 提供来自深度传感器的额外信息时，它就会生成一个具有 pixel depth masking 的改进算法，并以模块化流水线的形式表达出来。

3.3.2. Embodied agent: closed loop visual-language navigation using ChatGPT’s dialogue (Click for video)

在实验中，我们还评估了 ChatGPT 使用其对话功能作为感知-行动控制反馈回路的能力。在这种操作模式下，新的状态观察结果以对话文本的形式输入系统，机器人每一步都会执行模型的输出，从而产生新的观察结果。我们注意到，这类行为在很大程度上依赖于基于对话的 LLM，如 ChatGPT，它可以自然地接收观察结果流。我们使用 Habitat 模拟器构建了一个场景[18]，要求机器人导航到感兴趣的区域。每一步，我们都会向 ChatGPT 提供场景描述，即相对于Agent的可见物体的极坐标。我们对 ChatGPT 的输出进行了限制，使其只能返回前向运动距离和转弯角度。我们验证了该模型能够完成简单的导航任务，但对于更复杂的任务和环境，还需要进行更多的研究，才能以文本或矢量形式正确描述场景背景。

有关其他实验，请读者参阅附录 C。

3.4. Reasoning and common-sense robotics tasks

我们让 ChatGPT 回答简单的逻辑推理问题以及基本的机器人问题，如附录 D 所示。我们发现，ChatGPT 提供了丰富的常识和逻辑推理能力基础，在此基础上可以构建更高级的机器人能力。这种逻辑基础让用户可以更自然地与模型互动，而不必提示或从头定义每个概念。此外，ChatGPT 对控制，摄像头几何形状和物理形状因素等基本机器人概念的开箱即用的理解，使其成为建立可通用和用户友好型机器人管道的绝佳选择。

4. PromptCraft, a collaborative tool for LLM + Robotics research

提示（Prompt）是在大型语言模型（LLM）中生成所需行为的关键组成部分。在 LLM 与机器人技术的交叉领域，提示工程尤其具有挑战性，因为在这些领域缺乏提供积极（和消极）互动示例的全面，可访问的资源。为了填补这一空白，我们推出了 PromptCraft，这是一个供研究人员共享提示策略示例并在机器人环境示例中测试其算法的协作式开源平台。

PromptCraft 是一个基于 Github 的平台，允许研究人员分享不同机器人类别（如导航，抓取和操纵）中的提示工程策略示例。用户可以提交自己的示例，并对他人提交的示例进行评分，我们希望这将为使用 LLMs 的研究人员创建一个社区驱动的资源。提交的提示和对话主要基于文本，但我们也鼓励用户分享描述机器人行为的视频和图片，尤其是针对实际部署场景的视频和图片。

PromptCraft 不仅提供了一个分享提示示例的平台，还提供了一个带有 ChatGPT 封装程序的 AirSim [16] 环境，供研究人员在受控的模拟环境中对提示和算法进行原型开发。我们欢迎大家提供新的测试环境，以扩大研究人员测试算法的场景范围。

通过 Promptcraft，我们旨在支持提示工程的实证科学，使研究人员能够推动该领域的发展。

5. Related Work

Natural language and robotics

长期以来，自然语言处理（NLP）一直被认为是人机交互的重要组成部分。在许多应用中，机器人都能从 NLP 中受益，包括但不限于任务指令，导航和信息检索。传统上，使用语言模拟人与机器人的交互具有挑战性，因为它迫使用户在一套死板的指令中操作 [19]，或者需要复杂的数学算法来跟踪行动和目标物体的多种概率分布 [20，21]。最近的研究探索利用神经网络来隐式地跟踪语言和动作之间的复杂映射，但这类技术通常需要大量的标注数据进行训练 [22, 5, 6, 23] 。

Large (vision and) language models for robotics

论文 [24] 中介绍的 Transformer 架构给 NLP 带来了革命性的变化，在机器人技术领域也大有可为。变压器已被用于机器人控制和规划 [25, 26, 27]，物体识别 [28] 和机器人导航 [29]。变压器在机器人技术中更常见的用途是同时作为一种或多种模式的特征提取模块。这些系统通常与来自预训练的大规模视觉和语言模型的附加特征相结合 [30, 10, 31, 32, 11, 9]。

SayCan [31]等模型侧重于将 LLM 落地（grounding），从而使用自由形式的文本命令来计算值函数（value function），以便在机器人专用库中对最佳动作类型进行排序。另一方面，RT-1 [33] 采用端到端方法学习语言命令与低级动作之间的映射，而不使用中间的高级函数。近期的研究还探索了大型语言模型（LLM）在零点高级机器人任务规划方面的能力[15, 14, 12]。这些模型利用带有预定义函数，行为和示例的提示结构来指导模型答案的生成。[13]还探索了在桌面操作设置中使用用户和 LLM 之间的交互性。

从概念上讲，这些方法与我们利用 ChatGPT [1] 所做工作的主要区别在于，我们的 LLM 具备对话能力，允许用户交互式地改进和纠正机器人的行为（而不是从头开始重新设计提示并生成另一个零样本答案）。此外，我们的工作旨在提供一个可通用的管道和一套原则，供机器人学不同领域的研究人员使用，而不是专注于桌面操作或任务规划等单一领域。

Prompting LLMs with APIs, and its connections to symbolic AI

在为机器人应用设计 LLM 提示时，用户通常会使用高级 API 库来表示要使用的特定行为。我们可以将这种方法与经典的符号人工智能联系起来，后者使用逻辑和规则来表示和推理知识[34]。传统的符号人工智能方法在新知识获取和处理分布外数据方面存在困难，而我们相信 LLM 可以克服这些挑战。正如我们在第 2.1 节和第 3 节中所展示的，像 ChatGPT 这样的模型可以根据上下文组成新的原始函数，并自动为其生成代码。

6. Conclusions and Future Work

我们提出了一个将 ChatGPT 用于机器人应用的框架。该框架包括设计和实现一个用于机器人控制的 API 库，该 API 库可用于 ChatGPT 的提示工程。我们讨论了创建此类 API 的设计原则，以及可用于通过 ChatGPT 生成机器人应用代码的提示策略。所提出的框架允许用户通过一系列方法（包括模拟和人工检查）对生成的代码进行测试，验证和确认。我们演示了如何将该框架用于多种应用，从简单的常识性机器人知识任务一直到空中机器人，操纵和视觉导航的部署。

我们相信，这项工作只展示了机器人领域大型语言模型交叉领域的一小部分成果。我们希望不仅能激励其他研究人员迈出下一步，还能帮助他们利用 PromptCraft 协作工具取得成果。

我们强调，不应让这些工具完全控制机器人流水线，尤其是对安全要求较高的应用而言。鉴于 LLM 最终会产生错误响应的倾向，因此在机器人上执行代码之前，在人工监督下确保解决方案的质量和安全性相当重要。我们期待接下来的几项研究工作能采用适当的方法，为在机器人领域运行的 LLM 正确设计，构建和创建测试，验证和确认管道。

我们在这项工作中展示的大多数示例都是开放式的感知-行动循环，即 ChatGPT 生成代码以解决任务，之后并不向模型提供反馈。鉴于闭环控制在感知-行动循环中的重要性，我们希望未来在这一领域的大部分研究都能探索如何正确利用 ChatGPT 的能力，以文本或特殊用途模态的形式接收任务反馈。

6.1. ChatGPT for paper writing

请注意，本文主要是在 ChatGPT 的协助下撰写的，并由作者提供了提示。我们注意到，使用 LLM 可以大大加快写作过程，我们向感兴趣的读者推荐使用 LLM。

A. Additional examples on design principles on prompt engineering

B. Original initial prompts for robotics tasks examples

B.1. Spatial-temporal reasoning: catching a basketball with visual servoing

Full conversation found at: https://github.com/microsoft/PromptCraft-Robotics/blob/main/examples/spatial_temporal_reasoning/visual_servoing_basketball.md

Initial ChatGPT prompt:

B.2. Aerial robotics: real-world drone flight

Full conversation found at: https://github.com/microsoft/PromptCraft-Robotics/blob/main/examples/aerial_robotics/tello_example.md

Initial ChatGPT prompt:

B.3. Aerial robotics: AirSim industrial inspection

Full conversation found at:https://github.com/microsoft/PromptCraft-Robotics/blob/main/examples/aerial_robotics/airsim_turbine_inspection.md

Initial ChatGPT prompt:

B.4. Aerial robotics: AirSim obstacle avoidance

Full conversation found at:https://github.com/microsoft/PromptCraft-Robotics/blob/main/examples/aerial_robotics/airsim_obstacleavoidance.md

Initial ChatGPT prompt:

B.5. Embodied agent: Habitat navigation

Full conversation found at:https://github.com/microsoft/PromptCraft-Robotics/blob/main/examples/embodied_agents/visual_language_navigation_1.md

Initial ChatGPT prompt:

B.6. Embodied agent: AirSim object navigation

Full conversation found at:https://github.com/microsoft/PromptCraft-Robotics/blob/main/examples/embodied_agents/airsim_objectnavigation.md

Initial ChatGPT prompt:

B.7. Manipulation with curriculum learning: Picking, stacking, and building the Microsoft logo

Full conversation found at:https://github.com/microsoft/PromptCraft-Robotics/blob/main/examples/manipulation/pick_stack_msft_logo.md

Initial ChatGPT prompt:

C. Additional experiments

C.1. Zero-shot manipulation: Pick and place, stacking, and pushing

Full conversation found at:https://github.com/microsoft/PromptCraft-Robotics/blob/main/examples/manipulation/manipulation_zeroshot.md

C.2. Controlling multiple robot form factors from a single prompt

Full conversation found at:https://github.com/microsoft/PromptCraft-Robotics/blob/main/examples/multiple_robots/multiple_robots.md

D. Other commonsense/reasoning tasks

D.1. Computer vision problem

D.2. Transformation matrices

D.3. Balancing a ball on a plate

你可能感兴趣的:(具身智能（Embodied,AI）,chatgpt,机器人,具身智能,提示词工程,多模态)

IK分词初心myp
实现简单的分词功能，智能化分词添加依赖配置：4.10.4org.apache.lucenelucene-core${lucene.version}org.apache.lucenelucene-analyzers-common${lucene.version}org.apache.lucenelucene-queryparser${lucene.version}org.apache.lucenel
力扣热题100-------54. 螺旋矩阵海航Java之路力扣 leetcode 矩阵 java
给你一个m行n列的矩阵matrix，请按照顺时针螺旋顺序，返回矩阵中的所有元素。示例1：输入：matrix=[[1,2,3],[4,5,6],[7,8,9]]输出：[1,2,3,6,9,8,7,4,5]示例2：输入：matrix=[[1,2,3,4],[5,6,7,8],[9,10,11,12]]输出：[1,2,3,4,8,12,11,10,9,5,6,7]提示：m==matrix.lengthn
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
车载刷写架构 --- 整车刷写中为何增加了ECU 队列刷写策略？汽车电子实验室电子电器架构——刷写方案车载电子电气架构架构开发语言车载诊断进阶篇汽车中央控制单元HPC软件架构关于网关转发性能引起的思考
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：周末洗了一个澡，换了一身衣服，出了门却不知道去哪儿，不知道去找谁，漫无目的走着，大概这就是成年人最深的孤独吧!旧人不知我近况，新人不知我过往，近况不该旧人知，过往不与新人讲。纵你阅人何其多，再无一人恰似我。时间不知不觉中，来到新的一年。2025开始新的忙碌。成年人的我也不知道去哪里渡
车载诊断架构 ---面向售后的DTC应该怎么样填写？汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列 EV（电动汽车）常规知识必备架构面向售后的DTC 车载诊断架构 OEM怎么掌握软件开发能力车载通信网络槪述 android ZEVonUDS-J1979
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
车载诊断架构 --- 关于诊断时间参数P4的浅析汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
关于诊断时间参数P4的浅析我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：所谓鸡汤，要么蛊惑你认命，要么怂恿你拼命，但都是回避问题的根源，以现象替代逻辑，以情绪代替思考，把消极接受现实的懦弱，伪装成乐观面对不幸的豁达，往不幸上面喷“香水”来掩盖问题。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦
车载刷写架构 --- 刷写思考扩展汽车电子实验室电子电器架构——刷写方案架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
2018-09-27 aop相关蒋超_58dc
1.静态织入，需要使用aspectj专用的compilermaven工程可以采用：https://www.mojohaus.org/aspectj-maven-plugin/2.动态织入，配合spring，创建代理来执行3.
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
【ARM】FPU,VFP,ASE,NEON,SVE...是什么意思？亿道电子Emdoor ARM arm开发 ARM
1、文档目标对执行浮点和SIMD操作的逻辑的各种名称的缩写词进行简要解释。2、问题场景Arm处理器内核中有用于执行浮点和SIMD操作的逻辑，有各种名称。它们通常是一系列的缩写形式，因此本文旨在对每一个缩写词进行简要解释。3、软硬件环境1、软件版本：不涉及2、电脑环境：不涉及4、相关缩写FPU(Floating-PointUnit)浮点单元浮点单元是处理器核心中的一个模块，用于使用浮点数执行算术运算
《李清照》君如流星我如月，夜夜流光相皎洁小城爱夏天
蝶恋花[宋代]李清照永夜恹恹欢意少。空梦长安，认取长安道。为报今年春色好。花光月影宜相照。随意杯盘虽草草。酒美梅酸，恰称人怀抱。醉莫插花花莫笑。可怜春似人将老。此首词作于1127年的，当时的赵明诚还在江宁担任知府，后来因官职的调配，调去建康，因为在去建康的路上，感染了疾病后死亡，此时是1129年。李清照听到这个悲痛的消息之后连忙赶去，为其处理后事，她终是没有到达建康。当时的国家早已山河破碎，她只能
免费排版助手：智能修正段落 + 删除干扰符，杂乱文本一键变规范
各位文字工作者们！你们有没有被排版折磨到崩溃的时候？我跟你们说，我之前排版一篇文章，那简直就像在走迷宫，头晕眼花的！不过后来我发现了一款软件——排版助手！软件下载地址安装包这玩意儿是个文章智能排版工具，专门给新闻编辑、文摘网站这些文字工作者用的。它功能老多了，能修正段落，把那些乱七八糟的段落变得规规矩矩；还能删除干扰符，就像给文章做了个大扫除，把没用的东西都清理掉；简繁转换也不在话下，不管是简体还
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
是配角还是主角伽儸
图片发自App听朋友说这部剧很好就去追了看到曼丽死的时候我哭了好像看到了曾经的自己为了爱可以不顾一切就算默默陪着你也可以。就算你一次又一次的伤害有关于你我还是奋不顾身，我以为不会再喜欢别人可失望攒多了确实是绝望。离开你我遇见了更好的自己因为他。可我却变得小火翼翼把这份喜欢深埋心底但是在不经意间总会流露出对你的关心我不确定你的答案会因此疏远我。每次担心不已还要故作镇静假装不在意用行动去表达时却忐忑不
婴童医话（五百六十）妙手柯楠
探天地清浊之源，察阴阳顺逆之机。“乳食过饱蓄胃中，乳片不化吐频频，身热面黄腹膨胀。”伤乳吐者，因乳食过饱，停蓄胃中，以致运化不及，吐多乳片，犹如物盛满而上溢也。其证身热面黄，肚腹膨胀。治宜化其宿乳，安胃和中，节其乳食，自然止也。“过食伤胃腹胀热，恶食口臭吐酸粘，眼胞虚浮身潮热。”伤食吐者，因小儿饮食无节，过食油腻、面食等物，以致壅塞中脘而成也，其证肚腹胀热，恶食口臭，频吐酸粘，眼胞虚浮，身体潮热。
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
D124:如何训练独立思考力？大栗子_
当我们要判断一个理论或者思想是否正确，需要有三个层次，分别是体验、解释和分析。首先看体验。很多时候，我们会相信“听上去、感觉是对的”的事情。我们之前讲的太空笔的故事之所以大多数人都认为是对的，就是有一些看似真实的关键词，比如美国，NASA，设计等，这些词看起来非常权威，但是离我们又遥远，这时候我们的大脑就会放松警惕了。于是，我们毫不犹豫就接受了。说到这里，你有没有发现之前的电视广告中的各种高让我们
旧系统UI焕新陷阱：保留业务习惯与引入新交互的平衡点把控贝格前端工场 ui 交互
摘要**想给老旧系统换上“高颜值新衣”，却遭遇员工集体吐槽“不会用”？满心期待新交互能提升效率，结果用户操作频频出错，业务进度反而被拖慢？旧系统UI焕新本是优化体验的好机会，可在保留多年养成的业务操作习惯，与引入更先进便捷的新交互方式之间，却横亘着巨大鸿沟。稍有不慎，就会陷入“改了不如不改”的尴尬境地。这场关于“守旧”与“创新”的博弈，究竟该如何破局？一、旧系统UI焕新：一场甜蜜又棘手的改造工程旧
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
【Coze搞钱实战】3. 避坑指南：对话流设计中的6个致命错误（真实案例） AI_DL_CODE Coze平台对话流设计客服Bot避坑用户流失封号风险智能客服配置故障修复指南
摘要：对话流设计是智能客服Bot能否落地的核心环节，直接影响用户体验与业务安全。本文基于50+企业Bot部署故障分析，聚焦导致用户流失、投诉甚至封号的6大致命错误：无限循环追问、人工移交超时、敏感词过滤缺失、知识库冲突、未处理否定意图、跨平台适配失败。通过真实案例拆解每个错误的表现形式、技术根因及工业级解决方案，提供可直接复用的Coze配置代码、工作流模板和检测工具。文中包含对话流健康度检测工具使
平凡与伟大--父亲的一生张翔淋
10.寻找四表哥先生要账还是没有结果，做工程，每到年关都会和农民工一起去要工程款。生活不易。从张家口东站下车的父亲下了车才知道离他四表哥的所在地张北县还有好几十里路，父亲背着随身携带的薄薄的一床被子，在没有路，一人高的杂草淀子里越走越迷路，实在找不着方向了，随身携带的被子也被换了吃的。身无分文，又累又饿的父亲只好去了难民登记处。登记员看见父亲带着的地址要找的人是张北县粮食局的李进替，非常高兴的告诉
51晨间日记讨喜的鱼
2018年11月15日，马上一个月又过去一半，离过年也不远。每到这个时候，心底总有些焦虑。是不是又像去年一样的场景，没赚什么钱，还是一无所有。再有没有以前的潇洒，一无所有，一身轻松，身上有些东西一旦背负，就卸不掉。今天比预计的时间，晚了两个小时，原来说服自己是这么简单的事，告诉自己多睡10分钟。一睁眼，已经过了2小时，这是常有的事。自律必须时刻警惕，而懒惰是要打个盹。工作的话，最近还算顺利。天天写
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S