GoodluckTian

【译文】 PASS3D: Precise and Accelerated Semantic Segmentation for 3D Point Cloud

PASS3D：精确、快速的三维点语义分割点云

摘要

在这篇文章中，我们提出了PASS3D去实现逐点级的三维点云语义分割。我们的框架结合了传统几何方法的高效和深度学习方法的鲁棒性，包含两个阶段：阶段1，加速聚类生成算法会通过分割无地面的点云生成优化的聚类提案，能够在极短时间内生成较少冗余和较高召回率；阶段2，通过神经网络对这些聚类提案进行放大和进一步处理，估计每个点的语义，同时提出一种新的数据增强方法，提高网络对所有类别特别是非刚性物体（行人）的识别能力。在KITTI原始数据集上进行评估，PASS3D在一些结果上与最先进的技术形成鲜明对比，使其能够胜任自动驾驶系统中的3D感知。

代码还未开源，视频演示https://www.youtube.com/watch?v=cukEqDuP_Qw.

1 简介

自动驾驶技术作为一种极具发展前景的技术，越来越受到人们的重视。基于三维激光的感知是自主驾驶的重要技术解决方案之一。虽然三维激光雷达扫描仪可以直接提供距离测量，生成三维点云来捕获场景的几何结构，但是由于纹理信息的缺失，点云的语义分割仍然是一个很大的挑战。三维场景的感知需要对点云进行语义分割，这是一个尚未解决的问题。

本文介绍的工作主要是解决三维点云上的逐点语义分割问题，对每个三维点估计一个语义标签，如图1所示。之前的一些工作

【Fast segmentation of3d point clouds: A paradigm on lidar data for autonomous vehicleapplications】，【Efﬁcient online segmentation forsparse 3d laser scans】基于欧氏距离本能地分割点云。这些解决方案足够有效，但不提供语义信息。

受到基于图像的语义分割方法的启发，一些研究者提出了【Pixor: Real-time 3d objectdetection from point clouds,】，【Deep continuous fusionfor multi-sensor 3d object detection】，【Squeezeseg: Convolutionalneural nets with recurrent crf for real-time road-object segmentationfrom 3d lidar point cloud】，【Squeezesegv2:Improved model structure and unsupervised domain adaptation forroad-object segmentation from a lidar point cloud】，【Pointseg: Real-timesemantic segmentation based on 3d lidar point cloud】采用成熟的基于CNN的神经网络，将三维点云投影到二维平面中，预测每个像素的语义标签。SqueezeSeg和SqueezeSegv2等方法是实时的，但不是最优的，因为它们忽略了3D点云中的内部几何信息，导致性能不佳。

融合的方法【Frustum pointnetsfor 3d object detection from rgb-d data】【Pointfusion: Deep sensor fusion for3d bounding box estimation】【Joint 3d proposal generation and object detection from view aggregation】解决上述限制，通过连接多信息从相机和激光雷达。尽管如此，基于2d的检测可能会在一些具有挑战性的情况下失败，这些情况只能在3D空间中很好地观察到，而且由于要处理大量的图像和点云输入，通常运行缓慢。【Pointrcnn: 3d object proposal generationand detection from point cloud】的另一种方法是操作
直接生成三维数据，采用自底向上的方案生成三维包围盒建议和执行标准的三维包围盒优化。取得了良好的效果三维检测任务，但使用深度神经网络处理场景中的整体点，理论上耗时，且面临坐标偏差带来的问题。

针对上述挑战，我们提出了一种新的两阶段框架PASS3D(三维点云的精确和加速语义分割)，利用三维几何聚类算法和三维深度学习方案。该框架结合了传统几何方法的有效性和先进深度学习网络的鲁棒性。在第1阶段，我们利用三维空间的几何和拓扑结构去除地面点，并使用基于环的【Fast segmentation of3d point clouds: A paradigm on lidar data for autonomous vehicleapplications】方法快速地将其余点分割成数个聚类。然后优化聚类结果得到最终的提案（proposal）。在第二阶段，我们通过引入一种新的方法来消除坐标偏差，对提案进行规范化转换，然后将其放入一个强大的点集处理器中，如PointNet++，以获得点的语义信息。整个网络流程图如图2所示。

和最先进的Squeezesegv2相比，3D行人IoU提高16.5%，3D自行车提高17.2%，平均IoU提高7.9%。我们第一阶段的聚类实现了在5毫秒内达到89.5%的逐点召回率，每帧只有约30个提案的聚类。

我们工作的主要贡献如下：

（1）我们提出了可行的两阶段3D语义分割框架，结合了传统几何方法的高效和深度学习方法的鲁棒性，无信息损失即可获得纯3D功能失利。

（2）我们的加速聚类提议算法实现较高的按点召回率，而在极短的时间，这大大缩短了整体时间并减少后续计算，使其适用适用于自动驾驶应用。
（3）针对点云学习问题，提出了一种新的数据增强方法，有效地缓解了三维空间中的坐标偏差，提高了网络的性能和泛化能力，特别是对欧式空间的非刚体。
（4）在KITTI原始数据集上的实验表明，我们的方法比最先进的方法有显著的优势。我们的源代码即将开源。

2 相关工作

B. Douillard, J. Underwood, N. Kuntz, V. Vlaskine, A. Quadros,P. Morton, and A. Frenkel, “On the segmentation of 3d lidar pointclouds,” in 2011 IEEE International Conference on Robotics andAutomation, pp. 2798–2805, IEEE, 2011. 总结了几种基于迭代算法的地面点去除方法RANSAC和GP-INSAC
F. Moosmann, O. Pink, and C. Stiller, “Segmentation of 3d lidar datain non-ﬂat urban environments using a local convexity criterion,” in2009 IEEE Intelligent Vehicles Symposium, pp. 215–220, IEEE, 2009.使用range image计算点云中的局部凸包
I. Bogoslavskyi and C. Stachniss, “Efﬁcient online segmentation forsparse 3d laser scans,” PFG – Journal of Photogrammetry, RemoteSensing and Geoinformation Science, pp. 1–12, 2017.提出了一种有效的地面分割和聚类算法
M.-O. Shin, G.-M. Oh, S.-W. Kim, and S.-W. Seo, “Real-time andaccurate segmentation of 3-d point clouds based on gaussian process regression,” IEEE Transactions on Intelligent Transportation Systems,vol. 18, no. 12, pp. 3363–3377, 2017.直接提取的前景对象没有地面分割
D. Z. Wang, I. Posner, and P. Newman, “What could move? ﬁndingcars, pedestrians and bicyclists in 3d laser data,” in 2012 IEEEInternational Conference on Robotics and Automation, pp. 4038–4044,IEEE, 2012.关注整个过程，包括分割、聚类和分类。
D. Zermas, I. Izzat, and N. Papanikolopoulos, “Fast segmentation of3d point clouds: A paradigm on lidar data for autonomous vehicleapplications,” in 2017 IEEE International Conference on Robotics andAutomation (ICRA), pp. 5067–5073, IEEE, 2017.针对三维激光雷达点云的特点，提出了一种基于环的点云分割方法。

以上无语义信息

1）基于2D的方法

灵感来自成熟的基于图像的语义分割框架,几种方法项目点云到鸟瞰图(birds-eye-view)([10]、[3]、[4],[18])或FV(前视图)([5]、[6][7]),并使用一个2D CNN学习点云的特征检测或语义分割。在[3]中，利用特定高度编码的BEV输入，设计了一种快速单级探测器。这种方法只需要处理少量的数据。然而，这些方法的关键问题是在生成2D地图时丢弃了许多点，导致垂直或深度轴上的信息大量丢失。信息的丢失严重影响了三维特征学习的性能。

2）基于融合的方法

X. Chen, H. Ma, J. Wan, B. Li, and T. Xia, “Multi-view 3d object de-tection network for autonomous driving,” in Proceedings of the IEEEConference on Computer Vision and Pattern Recognition, pp. 1907–1915, 2017.
C. R. Qi, W. Liu, C. Wu, H. Su, and L. J. Guibas, “Frustum pointnets for 3d object detection from rgb-d data,” in Proceedings of the IEEEConference on Computer Vision and Pattern Recognition, pp. 918–927, 2018.
C. R. Qi, L. Yi, H. Su, and L. J. Guibas, “Pointnet++: Deep hierar-chical feature learning on point sets in a metric space,” in Advancesin Neural Information Processing Systems, pp. 5099–5108, 2017.

MV3D[18]采用激光雷达点云鸟瞰图和前视图以及RGB图像作为输入，获得多通道特征。在[8]中，使用二维检测网络来提出截锥体点云，然后使用PointNet++[19]来预测三维对象边界框。这些方法通常比其他方法表现得更好，但理论上运行缓慢。此外，基于2D图像的提案可能会在某些具有挑战性的情况下失败，而这些情况可以很好地观察到3d空间。

3）基于3D的方法

Y. Yan, Y. Mao, and B. Li, “Second: Sparsely embedded convolutionaldetection,” Sensors, vol. 18, no. 10, p. 3337, 2018.
Y. Zhou and O. Tuzel, “Voxelnet: End-to-end learning for point cloudbased 3d object detection,” in Proceedings of the IEEE Conference onComputer Vision and Pattern Recognition, pp. 4490–4499, 2018.

基于体素的方法，将点云数据离散到体素中，然后进行三维卷积。体素大小选择不当会影响性能，太大会丢失细节，太小会增加很多计算量。

S. Shi, X. Wang, and H. Li, “Pointrcnn: 3d object proposal generationand detection from point cloud,” arXiv preprint arXiv:1812.04244,2018.
C. R. Qi, H. Su, K. Mo, and L. J. Guibas, “Pointnet: Deep learningon point sets for 3d classiﬁcation and segmentation,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,pp. 652–660, 2017.
C. R. Qi, L. Yi, H. Su, and L. J. Guibas, “Pointnet++: Deep hierar-chical feature learning on point sets in a metric space,” in Advancesin Neural Information Processing Systems, pp. 5099–5108, 2017.

直接从点云学习点方面的特性。充分利用了三维信息，避免了体素方法的缺点。

受【Fast segmentation of3d point clouds: A paradigm on lidar data for autonomous vehicleapplications】的启发，我们在第一阶段的工作实现了基于环的聚类方法来分割点云和优化聚类提案。我们的语义分割网络在第二阶段直接使用三维点云数据，附加逐点的语义估计。

3 PASS3D的框架

在本节中，我们将介绍我们的两阶段逐点语义分割框架。完成的管道如图2所示，包括加速聚类提案阶段和逐点语义预测阶段。我们的主要观点是将整个场景分割并将点云聚集成多个有意义的子部分，然后将它们放入一个强大的点集处理器PointNet++中，以获得点分类标签。我们发现我们感兴趣的对象(如“汽车”、“行人”、“自行车”)在三维空间中是独立的，没有重叠，因此没有必要考虑场景中的所有点云来识别每个对象，只需要一个对象本身的先验点云即可。移除地面后的点云是自然地彼此分离。因此，我们认为对点云进行无地面聚类来获得候选聚类是可行和有效的。在此基础上，将聚类转化为功能强大的神经网络进行特征提取和语义分割。

A.第一阶段：加速聚类提案（proposal）

【其实和[1]的方法差不多，可以直接看它的论文，比较清晰一点】

基于深度学习的区域建议方法在二维图像中取得了显著的效果，但在三维点云场景中，由于三维搜索空间巨大，点云格式不规则，使得区域建议方法的效果较差。现有的PointRCNN，Second显著促进了三维点云识别的发展。然而，仍有一些问题需要解决，如提出的候选对象过多，将所有的点都放入神经网络中，导致计算量和时间消耗大幅增加。我们观察到3D场景中的物体是自然分离的，没有重叠。为此，我们提出了一种加速聚类的方法来生成聚类，并优化聚类得到最后结果，从而在很短的时间内实现了在很少候选对象的情况下达到高的点向召回率。图3展示了我们的集群建议结果。该部分一般分为三个步骤：地平面拟合、基于环的聚类和提案优化。

1）地平面拟合（论文【1】中的算法图）论文讲的不是很清晰，放算法图更好理解

2）环形聚类（论文【1】中的算法图）

3）提案优化

我们为每个集群生成一个最小的三维定向包围框，并保证其z轴垂直于地面。因为我们事先已经知道了感兴趣的对象(如“Car”、“行人”、“骑行者”)，我们将根据聚类中的点数和每个提案的包围框大小对提案进行排序，将不满意的聚类设置为背景。自适应阈值Thnum(聚类内点的数量)随着聚类与激光雷达距离的增加而减小，这是由于点云分布在更远的距离上更稀疏所致。

我们注意到，在划分地平面时，一些属于物体的点(如汽车轮子、人脚、标志底部)由于太靠近地面而被错误地计算为地。基于这个原因，我们扩大了面向3D的边界框，并将更多的点合并到优化提案中。

B.第二阶段:逐点语义分割

在本节中，我们的目标是预测每个点的类别，使用阶段-1中的聚类结果。该部分一般分为两个步骤：数据准备和基于学习的语义分割。

1）数据预处理

坐标转换 由于目标在激光雷达坐标系中分布在场景的各个位置，使得目标的坐标变化剧烈，使得神经网络难以收敛。考虑到这一点，我们将每个聚类作为样本，随机使用其三维方向包围框的一个底顶点作为局部坐标系的原点，并将包围框放在第一个八分区中，如图4所示。坐标系的改变不会影响点与点之间的相对位置，使得数据分布更加集中，使得神经网络更加关注点的相对位置而不是绝对位置。

数据增强 受二维或三维CNN工作[22]、[20]中训练数据扩充方法的启发，我们提出了一种新的点云学习问题的数据扩充方法。我们发现局部坐标系中点云分布的不平衡会影响神经网络的泛化能力。例如，在训练样本中，沿着局部x轴方向的车比沿着局部y轴方向的车多，这不应该影响神经网络。为了抑制点云分布不均匀所带来的不利影响，与其他[20]、[11]方法通常对整个场景进行扩展不同，我们提出了一种处理我们的提案的数据扩展方法，这种方法更加高效、有针对性。如图5所示，一个样本在局部坐标系中总共有8种表示(忽略垂直方向)。我们对样本进行旋转和镜像，以在不更改样本类别的情况下创建其余七个生成的样本。所有这八个样本都可能是通过我们的第一阶段方法在现实世界中获得的。我们将这八个样本混合到网络的训练集中，在训练过程中将对其进行随机取样。这样，基于学习的方法可能对点云视角的变化（局部坐标系选择）不敏感，并且可以在某种程度上减轻坐标偏差的负面影响。我们对此的理解是，非刚性物体(如行人和骑自行车的人)的形状是可变的，每一个样本在任何时刻都是独特和罕见的。该方法丰富了训练数据的非重复性和非对称性。在我们的实验中，这些物体得到了明显的改进。

2）基于学习的语义分割

我们的网络将预先准备好的聚类作为输入，并预测每个点的概率分数，该分数表明该点属于预先准备的类别的可能性有多大。我们利用PointNet++和多尺度分组作为我们的主网络，进而去学习区分用来描述原始点的逐点特征，它可以被其他三维神经网络灵活地代替。我们的网络在一个训练样本中提取了固定数量的N个点。如果样本中的点的个数NUM大于N，那么这些点将被随机选择。否则，这些点将随机重复。考虑到采样过程中NUM的丢失会影响神经网络的分类过程，我们定义了一个特征去补偿，它描述了NUM和N之间的关系（？）。PointRCNN[11]将距离信息加入到点特征中，但在实验中发现其影响很小。最后，我们连接在局部坐标系的点的坐标系，归一化点云强度，转换相对聚类点云数量为特征向量。

4 实验

5 总结

MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
【ARM】FPU,VFP,ASE,NEON,SVE...是什么意思？亿道电子Emdoor ARM arm开发 ARM
1、文档目标对执行浮点和SIMD操作的逻辑的各种名称的缩写词进行简要解释。2、问题场景Arm处理器内核中有用于执行浮点和SIMD操作的逻辑，有各种名称。它们通常是一系列的缩写形式，因此本文旨在对每一个缩写词进行简要解释。3、软硬件环境1、软件版本：不涉及2、电脑环境：不涉及4、相关缩写FPU(Floating-PointUnit)浮点单元浮点单元是处理器核心中的一个模块，用于使用浮点数执行算术运算
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
2024最新微信红包封面序列号大全+领取时间表(持续更新) 全网优惠分享
微信红包封面序列号兑换码，每天，我们都在奔波于现实的雾霾里。工作、生活、压力、困扰，如同无尽的泥潭，让我们时刻感到疲惫不堪。然而，在这个被喧嚣包围的世界，我们是否还能保持内心的宁静和平淡？微.信搜索:「封面院」关注公众号可领取红包封面序列号。最新微信红包封面序列号：先到先得，抢完为止：1、pdiqgLsY1lR2、vC8tY0VRf3D3、j0kzzrfwl6Y4、dqRCUZ0lwmJ5、ldT
D13-0729-阿凡提阿凡提在冰川
D13D13-0729-阿凡提如何避开听力训练中的常见坑——Zoe分享听力训练中的常见坑听力训练中的常见坑看不懂，写不出：生词障碍，背景知识能看看懂，写不出：口音、语音现象（连读、弱读、爆破等）、语法一些语音现象失去爆破：两个爆破音连在一起，前面的失去爆破击穿：辅音、爆破音后面接h一般不发音，Youkown听力练习最大的坑听完不复习表现：：听完不对材料进行复习，仅仅对一些错词进行更正，不做进一步拓
2021-08-03英语单词背诵Unit33 从入门到放弃_菠萝君
这里的单词只是我个人的一些联想记忆，如果大家有什么更好的记忆方式，可以在评论区分享出来，感谢。或者有什么觉得特别难记忆的单词和语法也可以分享出来，大家一起讨论记忆。Unit33dumb 拆分：du（毒）+mb（面包）联想：毒面包吃下去就变哑了释义：a.哑的，哑口无言的，愚蠢的dye 对比：eye眼睛dye染料，染色ruralechoreflectrepeat 拆分：rep（热评）+eat（吃）
道德经|第十一章有以为利，无以为用嘿魏央子
【原文】当其无，有车之用。埏埴以为器，当其无，有器之用。凿户牖以为室，当其无，有室之用。故有之以为利，无之以为用。【译文】三十根辐条集结为一个车轮，正是因为它们拱成一个圆形的中空之处，才能连接车轴，成就了车轮的用途。揉和黏土制成陶器，正是因为它留有中空的部分，才成就了它的用途。开凿门窗建成居室，正是因为它中间是空的，才成就了房屋的用途。所以，“有”给人方便之利，“无”发挥着作用。【碎碎念】乐于助人
Docker ℡余晖^ 黑马点评项目相关问题和笔记 docker eureka 容器
在黑马点评项目中，在谈到Redisson解决redis的主从一致性问题时，弹幕提到了Docker，本文来简单了解一下Docker，我的初步理解运维是维护多个集群的稳定，那它和VM虚拟机的区别又是什么？，如果要更深入地理解与学习（运维工程师），可以到b站搜索专门的课程（SpringCloud）。一、Docker是什么？重新理解“容器化”的本质1.1Docker的定义Docker是一个开源的容器化平台
Spring Boot与云原生：微服务架构的创新实践 tmjpz04412 spring kubernetes 云原生 java graphql
引言：Spring生态的演进与现状Spring框架的发展历程与核心设计理念当前Spring生态的核心组件（SpringBoot、SpringCloud、SpringData等）行业对Spring生态的依赖与创新需求SpringBoot的创新实践1.自动化配置与启动优化条件装配（@Conditional）的深度定制案例启动类加载机制与类路径扫描优化示例：通过自定义Starter实现快速集成第三方服务
OpenCloudOS 城市行·成都站圆满落幕，共探操作系统技术新未来！ CSDN资讯业界资讯资讯数据库人工智能
7月26日，由OpenCloudOS社区主办，海光信息战略合作的OpenCloudOS城市行・成都站活动在成都欧洲中心圆满举办，线上观看人次超3万。当前，数字化浪潮席卷全球各行各业，在国产化进程加速的背景下，操作系统的技术突破与生态构建不仅是保障信息安全的关键，更是推动产业升级、实现高质量发展的必由之路。然而，国产操作系统在性能优化、安全防护、多场景适配等方面仍面临诸多挑战，亟需产业链上下游协同创
window显示驱动开发—Direct3D 11 视频设备驱动程序接口 (DDI) 程序员王马 windows图形显示驱动开发音视频
这些设备驱动程序接口(DDI)是新的或针对Windows8更新的：CalcPrivateCryptoSessionSizeCalcPrivateAuthenticatedChannelSizeCalcPrivateVideoDecoderOutputViewSizeCalcPrivateVideoDecoderSizeCalcPrivateVideoProcessorEnumSizeCalcPri
window显示驱动开发—支持 Direct3D 版本 10.1
1.Direct3D10.1的版本标识(1)版本号与头文件定义API版本号:D3D10_1_SDK_VERSION(在d3d10_1.h中定义)运行时检测:通过ID3D10Device::CheckFeatureSupport查询D3D10_FEATURE_LEVEL_10_1支持。D3D10_FEATURE_LEVELfeatureLevel=D3D10_FEATURE_LEVEL_10_1;i
window 显示驱动开发-Direct3D 呈现性能改进（四）程序员王马 windows图形显示驱动开发驱动开发
调用资源创建、映射和取消映射函数的行为更改对于WDDM1.3及更高版本驱动程序实现的这些函数，Direct3D运行时为映射默认方案提供一组受限的输入值。这些受限值仅适用于支持功能级别11.1及更高版本的驱动程序。CreateResource(D3D11)函数—这些输入D3D11DDIARG_CREATERESOURCE结构成员受到限制：调用资源创建、映射和取消映射函数的行为更改对于WDDM1.3及
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
草书我还是喜欢创作李白的诗！（书法：张德进）金宝斋德进书法
1李白：赠汪伦李白乘舟将欲行，忽闻岸上踏歌声。桃花潭水深千尺，不及汪伦送我情。译文李白乘舟将要远行离去，忽听岸上传来踏歌之声。即使桃花潭水深至千尺，也比不上汪伦送我之情。2李白的《黄鹤楼送孟浩然之广陵》故人西辞黄鹤楼，烟花三月下扬州。孤帆远影碧空尽，唯见长江天际流。(唯通）译文友人在黄鹤楼与我辞别，在柳絮如烟、繁花似锦的阳春三月去扬州远游。孤船帆影渐渐消失在碧空尽头，只看见滚滚长江向天际奔流。3唐
环境艺术设计必学的“3D建模与渲染软件”指南
在环境艺术设计领域，掌握高效的设计软件是学生入门阶段普遍关注的核心问题。优秀的软件如同设计师的得力助手，能够精准表达设计创意、显著提升工作效率，在设计流程的各个环节都发挥着不可或缺的作用。根据功能划分，环艺设计常用软件主要涵盖建模、渲染、后期处理及辅助工具四大类。本文将为您梳理环艺设计中必学的核心软件。一、核心建模软件建模是将设计构思转化为三维模型的关键步骤。以下两款软件在环艺设计中应用最为广泛：
云端渲染：重塑影视、游戏与设计行业的算力革命
导言：云端渲染技术通过将繁重的图形计算任务迁移至云端强大的计算集群，有效突破了传统渲染对高性能本地硬件和漫长等待周期的依赖，显著降低了制作成本与门槛。它正日益成为驱动影视、游戏及设计行业创新的核心技术。本文将深入解析云端渲染的技术原理，并探讨其如何深刻变革这三大行业的格局与未来。一、云端渲染的技术原理：解构算力革新云端渲染，其核心在于将高负载的图形处理任务——如复杂的3D建模、动画特效、光影计算及
2025年7月技术问答第1期大势智慧实景三维三维建模教程问答答疑干货
1.如图，用重建大师时重建好几次空间区域都是空的，周围的建模成功，该如何处理？答：确定下是中间两个缺失瓦块的名称，可以对瓦块右键清理中间结果，重新提交下生产。2.网格大师可以合并OSGB和3Dtiles的根结点吗，，不是想要的单独只有一个目录的那种，是不是只有最高级的那个文件夹里面的瓦片才是最终结果？答：根节点合并，只合并头文件，不会把瓦块整个合并。网格大师是一款能够解决实景三维模型空间参考、原点
BEYOND BINARY REWARDS: TRAINING LMS TOREASON ABOUT THEIR UNCERTAINTY 樱花的浪漫大模型与智能体对抗生成网络与动作识别强化学习人工智能语言模型自然语言处理机器学习深度学习
https://gist.github.com/josherich/8a30dbf3d6ae0cae1048c3331f38fe80https://gist.github.com/josherich/8a30dbf3d6ae0cae1048c3331f38fe801引言与此担忧一致，研究表明，即使最初校准良好的大型语言模型（LLMs）在RL训练后也会变得过度自信（Lengetal.,2
Python 网络科学（三）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/3df7c5feb0bf40d7b9d88197a04b0b37译者：飞龙协议：CCBY-NC-SA4.0第八章：自我中心网络分析前一章内容非常丰富，我们学习了如何可视化和分析整个网络。相比之下，本章应该会感觉更简单，内容也会少得多。在之前的章节中，我们学习了如何获取和创建网络数据，如何从网络数据构建图形，如何清理图形数据，以及如何做一些有趣的事情
不会PS也不会建模，却想把敦煌鸣沙山塞进小方块里！自律的音律
掐指一算，好像很久没出特殊玩法的教程了~刚好前几天有小伙伴提问：有没有立体图表可以参考一下？由此延伸到以前发的一篇文章，里面整合了一些高质量的立体图表：我知道，PPT自带的图表你已经看腻了，是时候养养眼啦！那么问题来了，文章中的这种效果，要是只会PPT能不能做？经过@隔壁家老廖的提醒，通过关键词microworld找到了一些参考图：仔细想了想，似乎也没有很难，主要是用到了裸眼3D效果，结合切面光影
Terraform 系列-Terraform Cloud 比 Terraform OSS 有哪些增强？东风微鸣
系列文章Terraform系列文章前言最近在使用TerraformCloud来置备OCI的AlwaysFreeTier,发现它非常好用，相比TerraformOSS,用起来省心多了。也借此总结学习下：TerraformCloud比TerraformOSS有哪些增强，这些增强功能面向哪些客户，解决了哪些痛点？可以作为我们基于Terraform开发自己的IaC云平台的经验。TerraformOSS的功
Unity 程序运行一段时间后Game界面出现黑屏的一种情况 zhannghong2003 Unity unity 游戏引擎
经过排查，发现是Camera(相机)的Z轴一直变大导致的黑屏。造成这种情况的原因是代码：VMouseTransform.position=Camera.main.ScreenToWorldPoint(Input.mousePosition)；Camera(相机)设置成为跟随VMouseTransform。所以会出现Z轴逐渐变大的情况，最后导致黑屏。改代码为：Vector2vMouseNeed=Ca
C#返回两个数组或多个数组，函数方法的一种写法 zhannghong2003 C#c#
public(float[]x,float[]y)GetPolygonCollider2DPoints(PolygonCollider2Dobjects){Vector2[]points=objects.points;float[]x=newfloat[points.Length];float[]y=newfloat[points.Length];for(inti=0;i
学习中医经典《黄帝内经》养生之道（第3天）风和日丽_3c0f
《黄帝内经素问·四气调神大论》\n【原文】秋三月，此谓容平，天气以急，地气以明，早卧早起，与鸡俱兴，使志安宁，以缓秋刑，收敛神气，使秋气平，无外其志，使肺气清，此秋气之应，养收之道也。逆之则伤肺，冬为飧泄，奉藏者少。\n译文：秋天三个月，是草木自然成熟的季节，天气劲急，地气清明，适应这种环境，应当早睡早起，保持神志安定，以舒缓秋天劲急之气对身体的影响。尽量精神内守，不急不躁，以使秋天肃杀之气得以平
尚庭公寓-学习跟敲笔记（二） wenbinglin66 学习笔记 spring boot java
管理端后端开发-租赁管理模块1.看房预约管理1.1根据ID更新预约状态在ViewAppointmenController中增加内容@Operation(summary="根据id更新预约状态")@PostMapping("updateStatusById")publicResultupdateStatusById(@RequestParamLongid,@RequestParamAppointme
道德经若齐
第十七章悠兮贵言，功成事遂太上，下知有之。其次，亲而誉之。其次，畏之。其次，侮之。信不足焉，有不信焉。悠兮其贵言，功成事遂，百姓皆谓：我自然。译文最高明的统治者，人民只知道他的存在。次一等的统治者，人民尊重称赞他。再次一等的，人民畏惧他。更次一等的，人民轻视他。统治者的诚信不足，人民自然不信服他。统治者悠闲自在，不随意发号施令，等到事情办成功了，百姓都会说：“我们本来就是这样的。”解读心得1．本章
三国萌将风檐展书读_d1b0
全新三国，全新演绎！游戏采用新一代Unity3d引擎、实时打击计算等众多技术，通过最轻松的操作即可体验到策略战斗、双技能战斗、多角色养成和搞笑幽默的三国故事等内容。清新呆萌画风，爆笑穿越剧情，让你尽可任性耍酷扮傻，活力四射。萌趣的风格，反转的故事，为玩家全新打造专属于你的爆笑三国。
V-Ray 7.00.08 for 3ds Max 2021-2026 安装与配置教程（含语言补丁）
本文介绍V-Ray7.00.08渲染器在3dsMax2021-2026各版本中的安装与使用配置步骤，适合需要进行可视化渲染工作的设计师、建筑师及相关从业者。附带语言补丁配置方式，帮助用户获得更顺畅的使用体验。一、安装文件准备软件名称：V-Ray7.00.08for3dsMax适用版本：3dsMax2021至2026安装包大小：约627MB补丁与语言文件：可选（用于简化界面与优化流程）软件地址（3d
排查解决腾讯云服务器存在对外攻击行为，已阻断该服务器对其他服务器端口（TCP：6379）的访问
【腾讯云】服务违规封禁提醒解决方法来自腾讯客服https://cloud.tencent.com/document/product/296/9604，这是我们给您的建议，建议您排查下您的服务器情况您现在登录上您的服务器了嘛您执行下crontab-l给我看下在执行netstat-ano|egrep"tcp|udp"redis端口这里有问题您执行netstat-tupln给我看下<
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin