zzfive

Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction

论文链接：Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction

文章目录

简介
预测下一个token自回归模型范式分析
VAR详解
- 分词
- 实现细节
- 幂律缩放定律
- 零样本泛化能力
结论

简介

本文提出的视觉自回归建模/VAR这种新范式，其将图像的自回归学习重新定义为从粗到细的“下一个尺度预测”或“下一个分辨率预测”，与常规的LLM预测下一个token的范式不同。VAR首次基于GPT架构的AR模型在图片生成方面超过了扩散模型，在 ImageNet 256×256 基准测试中，FID、IS分数均大幅提高，推理速度也快了将近20倍。实验证实，VAR在图像质量、推理速度、数据效率和可扩展性等多个维度由于DiT，且其具有明显的Scaling规律，在图像修复、外绘、编辑等下游任务中具有较好的泛化能力。

图1 不同自回归生成模型

图1中对比展示了三种自回归生成模型，(a)中是常规的基于预测下一个token范式的自回归模型/AR，GPT、LLaMa等LLM模型均是此范式；(b)中是与(a)一样，以光栅扫描将连续图片转换为离散tokens，通过预测下一个token进行图片生成的自回归模型；©中是文本提出的VAR，即从粗到细的多尺度自回归预测模型，可以看出，随着预测，图片尺度变大，内容由粗糙到精细。
VAR借鉴了人类通常以分层方式感知或创建图像的本能，即先捕捉全局信息，再处理局部细节；这种多尺度、从粗到细的顺序过程正好与自回归建模需要定义数据顺序相对应，故启发了开发人员即将图像的自回归学习定义为图1©中的“预测下一个尺度”，而不是传统的“预测下一个token”的范式。VAR中，先将图像编码为多尺度token maps，从1×1的token map开始自回归过程，逐渐扩展分辨率，即每一步Transformer基于先前所有的token maps预测下一个更高分辨率的token map。本文贡献如下：

提出一种采用多尺度自回归范式并结合下一尺度预测的新型视觉生成框架，为计算机视觉领域的自回归算法设计提供了新见解；
对 VAR 模型缩放定律及零样本泛化潜力的实证验证，初步模拟了大型语言模型（LLMs）的性能特性；
视觉自回归模型性能的一项突破性进展，首次使 GPT 风格的自回归方法在图像合成任务中超越强大的扩散模型；
一套全面的开源代码套件，涵盖 VQ 分词器和自回归模型训练流程，助力推动视觉自回归学习的发展。

预测下一个token自回归模型范式分析

此范式需要进行类似的分词操作，即先将连续的2D图片数据分割为离散的tokens，然后将其构建为1D的tokens序列。离散这一步往往是通过训练一个VQVAE模型实现，由编码器 $ $\mathcal{E}$ 、量化器 $\mathcal{Q}$ 、解码器 $\mathcal{D}$ 和码本器 $\mathcal{Z} \in \mathbb{R}^{V \times C}$ 组成。编码器将图片转换为固定尺寸的特征图 $\in \mathbb{R}^{h \times w \times C}$ ，量化器将 $f$ 与码本中的向量进行相似度对比装起转换为离散的tokens $\in [V]^{h \times w}$ 。此时 $q$ 仍是二维网格排列，还不是一维序列。图像tokens顺序必须为单向自回归学习显示定义，常规的自回归方法使用光栅扫描、螺旋扫描或Z曲线排序等策略将 $q$ 展平为一维序列 $(x_1,\cdot\cdot\cdot,x_{h \times w})$ ，然后通过预测写一个token进行自回归训练。此种图片生成模型有以下不足：

数学前提违规：在VQVAE中，编码器通常生成图像特征图 $f$ ，其中所有位置 $(i, j)$ 的特征向量 $f^{(i,j)}$ 存在相互依赖关系。因此，经过量化和扁平化处理后，token序列 $(x_1,\cdot\cdot\cdot,x_{h \times w})$ 仍保留双向相关性。这与自回归模型的单向依赖假设相矛盾 —— 该假设要求每个token $x_t$ 仅依赖于其前缀序列 $(x_1,x_2\cdot\cdot\cdot,x_{t-1})$ ;
无法执行某些零样本泛化：与问题 1 类似，图像自回归建模的单向性限制了其在需要双向推理任务中的泛化能力。例如，给定图像的底部时，模型无法预测其顶部内容；
结构退化：扁平化处理破坏了图像特征图中固有的空间局部性。例如，token $q^{(i,j)}$ 与其 4 个直接相邻token $q^{(i\pm1,j)}$ 、 $q^{(i,j\pm1)}$ 因空间邻近而具有紧密相关性。但这种空间关系在一维序列 $x$ 中被削弱 —— 单向约束会降低这些相关性；
效率低下：使用传统自注意力 Transformer 生成图像token序列 $(x_1,x_2,\cdot\cdot\cdot,x_{n \times n})$ 时，需经历 $O(n^2)$ 次自回归步骤，计算成本高达 $O(n^6)$ 。

VAR详解

VAR架构下，自回归单元是token map。VAR先将图像特征图 $\in \mathbb{R}^{h \times w \times C}$ 量化为K个多尺度token映射 $(r_1,r_2,\cdot\cdot\cdot,r_K)$ ，每个映射的分辨率 $h_k \times w_k$ 递增，最终 $r_K$ 的分辨率与原始特征图 $\times w$ 匹配。自回归似然公式为：
$p(r_1,r_2,\cdot\cdot\cdot,r_K)= \prod_{k=1}^{K} p(r_k|r1,r_2,\cdot\cdot\cdot,r_{k-1}) \tag1$
其中每个自回归单元 $r_k \in [V]^{h_k \times w_k}$ 是尺度 $k$ 的token map，其包含 $h_k \times w_k$ 个tokens。序列 $(r_1,r_2,\cdot\cdot\cdot,r_{k-1})$ 称为 $r_k$ 的前缀，在第 $k$ 次自回归步骤中， $r_k$ 中所有的 $h_k \times w_k$ 个tokens基于 $r_k$ 的前缀和对应的第 $k$ 个位置嵌入map并行生成。

图2 VAR训练示意图

图2展示VAR的两阶段训练过程。第一阶段在图片上训练多尺度VQVAE，其可以将图片转换为 $k$ 个token maps，为第二阶段训练提供Ground Truth。第二阶段通过“下一尺寸预测”训练Transformer，其以 $([s],r_1,r_2,\cdot\cdot\cdot,r_{K-1})$ 作为输入预测 $(r_1,r_2,r_3\cdot\cdot\cdot,r_K)$ 。训练过程会使用块级因果注意力掩码确保 $r_k$ 只与 $r_{\leq k}$ 进行注意力计算，使用标准交叉熵损失训练。推理阶段可使用KV-Caching，无需使用掩码。VAR解决了上述讨论的传统AR模型的三个问题：

如果约束每个 $r_k$ 仅依赖于其前缀，即获取 $r_k$ 的过程仅与 $r_{\leq k}$ 相关，那么数学前提就得到了满足。这一约束是可接受的，因为它符合自然的从粗到细的递进特性，例如人类的视觉感知和艺术绘画过程;
空间局部性得以保留，原因在于：(i) VAR 中不存在扁平化操作，(ii) 每个 $r_k$ 中的token完全相关，多尺度设计进一步强化了空间结构；
生成具有 $\times n$ 隐变量的图像时，复杂度显著降低至 $O(n^4)$ ，这种效率提升源于每个 $r_k$ 中token的并行生成。

分词

采用与VQGAN相同架构，修改了多尺度量化层。对特征图 $f$ 或重建图 $\hat{f}$ 采用残差设计的编码和解码流程详见算法1和算法2。实验发现，这种残差式设计比独立插值方法表现更优。算法 1 表明，每个 $r_k$ 仅依赖于其前缀序列 $(r_1,r_2,\cdot\cdot\cdot,r_{k-1})$ 。请注意，所有尺度共享一个码本 $Z
$，以确保每个 $r_k$ 的token属于同一词表 $[V]$ 。为解决将 $z_k$ 上采样至 $h_K \times w_K$ 时的信息损失问题，使用了 $k$ 个额外的卷积层 $\{\phi_k\}_{k=1}^K$ 。将 $f$ 下采样至 $h_k \times w_k$ 后不使用卷积操作。

图3 算法1-2

实现细节

VAR中的分词器采用原始VQVAE架构，附加 $k$ 个额外的卷积层的量化方案，额外增加0.03M参数。所有尺度共享一个码本，尺寸大小 $V = 4096$ 。使用常规的VQVAE复合损失在OpenImages上训练，空间下采样率为16。

transformer部分采用类似于GPT-2和VQGAN标准的仅解码器Transformer架构，集成自适应归一化层/AdaLN。对于类别条件生成任务，将类别嵌入作为起始token $[s]$ ，同时作为AdaLN的条件输入。实现发现，在注意力计算前将查询/queries和键/keys归一化为单位向量可稳定训练过程。模型未采用RoPE、SwiGLU或RMS Norm等LLM中常用技术。模型宽度 $w$ ，注意力头数 $h$ ，丢弃率 $d r$ 随深度 $d$ 线性缩放，具体如下所示：
$w=64d,\quad h=d,\quad dr=0.1\cdot\frac{d}{24} \tag2$
因此，深度为 $d$ 的VAR transformer模块的主要参数数量 $N$ 如下计算：
$\underbrace{d \cdot 4w^2}_{\text{self-attention}} + \underbrace{d \cdot 8w^2}_{\text{feed-forward}} + \underbrace{d \cdot 6w^2}_{\text{adaptive layernorm}} = 18dw^2 = 73728d^3 \tag3$
所有模型均采用相似的设置进行训练：每个batch size为 256 的批次的基础学习率为 $10^{-4}$ ；使用 AdamW 优化器，参数 $\beta_1=0.9,\beta_2=0.95,\text{decay}=0.05$ ；取决于模型规模，批次大小为 768 至 1024，训练轮次为 200 至 350。评估结果表明，这种简单的模型设计具备良好的可扩展性和泛化能力。

幂律缩放定律

LLM模型中的幂律缩放定律已得到证实并广泛应用，该定律可以通过小模型的性能指导训练大模型，便于合理分配计算资源，VAR也具有明显的幂律缩放定律。本文在ImageNet上训练了12种不同规模的模型，基于公式(3)可知模型参数量主要与深度 $d$ 相关，将深度从6递增至30，参数量从1800万到20万亿不等；每轮训练包含128万张或VQVAE转化后对应8700亿个图像tokens。对于不同规模的模型，训练轮次为200~350轮不等。基于上述实验，可针对在tokens数量 $T$ 充足的情况下，模型参数 $N$ 与最优训练计算量 $C_{min}$ 的缩放定律。

图4 VAR transformer模型规模 N 的缩放定律

在包含5万张图像的ImageNet验证机上进行评估，主要计算交叉熵损失 $L$ ，token预测错误率 $E rr$ ，结果如图4所示。图4表示了VAR的缩放定律，其中包含幂律拟合曲线(虚线)和图例中的公式。接近零的小指数 $\alpha$ 表明，当扩大 VAR Transformer 规模时，测试损失 $L$ 和token错误率 $E rr$ 均呈现平滑下降趋势。坐标轴均采用对数刻度。皮尔逊相关系数接近−0.998，表明 $\log(N)$ 与 $\log(L)$ 或 $\log(N)$ 与 $\log(Err)$ 之间存在强线性关系。

从图4中可以观察到测试损失 $L$ 随参数量 $N$ 变化呈现明显的幂律缩放趋势，该关系可表示为：
$L_{last}=(2.0 \cdot N)^{-0.23} \quad \text{and} \quad L_{avg}=(2.5 \cdot N)^{-0.20} \tag4$
尽管缩放定律主要围绕测试损失展开研究，但本文通过实验也观察到token错误率 $E rr$ 呈现类似的幂律趋势：
$Err_{last}=(4.9 \cdot 10^2N)^{-0.016} \quad \text{and} \quad Err_{avg}=(6.5 \cdot 10^2N)^{-0.010} \tag5$
这些结果验证了 VAR 强大的可扩展性，通过扩大 VAR Transformer 的规模能够持续提升模型的测试性能。

对于12个模型中的每一个，还记录了其测试损失 $L$ 和token错误率 $E rr$ 与计算量 $C$ 的关系，计算量的单位为PFlops，即每秒 $10^{15}$ 次浮点运算，结果如图5所示。图5中绘制了 $L$ 和 $E rr$ 的帕累托前沿，以突出达到特定损失或错误率所需的最优训练计算量 $C_{min}$ 。经拟合得到的 $L$ 和 $E rr$ 与 $C_{min}$ 的幂律缩放定律如下:
$L_{\text{last}} = \left(2.2 \cdot 10^{-5} C_{\text{min}}\right)^{-0.13} \quad \tag6$
$L_{\text{avg}} = \left(1.5 \cdot 10^{-5} C_{\text{min}}\right)^{-0.16} \tag7$
$Err_{\text{last}} = \left(8.1 \cdot 10^{-2} C_{\text{min}}\right)^{-0.0067} \tag8$
$Err_{\text{avg}} = \left(4.4 \cdot 10^{-2} C_{\text{min}}\right)^{-0.011} \quad \tag9$
上述公式在最优计算量 $C_{min}$ 的6个数量级范围内均成立，实验表明当使用足够数据训练时，更大的 VAR transformer 模型计算效率更高，因为它们可以用更少的计算量达到相同的性能水平。

图5 最优计算量的缩放定律

图5中线条颜色表示不同模型规模，红色虚线为幂律拟合曲线（图例中包含公式）。坐标轴采用对数刻度，皮尔逊相关系数接近 0.99，表明 $log(C_{min})$ 与 $\log(L)$ 或 $log(C_{min})$ 与 $\log(Err)$ 之间存在强线性关系。

零样本泛化能力

在图像修复与扩展任务中，对 VAR-d30 进行测试，通过在掩码外部使用教师强制真实token、仅让模型在掩码内部生成token（且未注入任何类别标签信息），其在不修改网络架构或调整参数的情况下取得了不错效果；同时，遵循 MaskGIT 在类别条件图像编辑任务上的测试显示，模型被强制仅在边界框内基于类别标签生成token时，能产生与周围上下文良好融合的合理内容。这两项任务的结果均证实了 VAR 在不同下游任务中无需特殊调整即可实现有效泛化的能力。图6展示了具体图片结果，表明VAR 无需特殊设计和微调即可泛化到新的下游任务。

图6 VAR的零样本能力评估

结论

视觉自回归建模（VAR）的是一种新型视觉生成框架，其特点在于：1）从理论上解决了标准图像自回归（AR）模型的一些固有问题；2）使基于语言模型的 AR 模型首次在图像质量、多样性、数据效率和推理速度方面超越了强大的扩散模型。当将 VAR 扩展到 20 亿参数时，其测试性能与模型参数或训练计算量之间存在明显的幂律关系，皮尔逊系数接近 - 0.998，这表明该框架可用于稳健的性能预测。这些缩放定律以及零样本任务泛化的可能性 —— 作为大型语言模型（LLMs）的标志 —— 现已在 VAR transformer 模型中得到初步验证。

通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
EasyPlayer播放器系列开发计划2025 xiejiashu EasyPlayer EasyPlayer EasyPlayer播放器 RTSP播放器 js播放器 Web播放器
EasyPlayer系列产品发展至今，已经超过10年，从最早的EasyPlayerRTSP播放器，到如今维护的3条线：EasyPlayer-RTSP播放器：Windows、Android、iOS；EasyPlayerPro播放器：Windows、Android、iOS；EasyPlayer.js播放器：H5；这3个播放器各有各的应用场景，用户量也是巨大，像RTSP版本的播放器，到今天依然还有很多低
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
Android 基础知识：Android 应用权限详解流水mpc android
这篇文章为大家系统的梳理一下Android权限相关的知识，在日常开发中，我们都用过权限，但是对于权限的一些细节我们可能掌握的还不够全面，这篇文章会全面的为大家介绍权限相关的知识。当然，本篇文章依然是参考了Google的官方文档：应用权限。本文目录一、认识Android权限（一）Android系统为什么需要权限？Android系统设置权限的目的是保护Android用户的隐私。对于用户的敏感数据And
面试必考题：Android Binder 机制详解大模型大数据攻城狮 android binder 面试 react native kotlin dalvik retrofit
目录第一章：Binder的基本概念什么是Binder？多角度解读Binder第二章：Binder的工作机制Binder的整体流程服务注册：从零到有的第一步服务查询：找到目标的“地图”服务调用：请求与响应的旅程Binder驱动的幕后功劳为什么Binder这么快？第三章：Binder在系统架构中的角色Activity：界面背后的通信枢纽Binder的角色实例分析Service：后台任务的跨进程支柱Bi
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
Android 媒体播放开发完全指南安卓开发者 Android Jetpack android 媒体 python
引言在当今移动应用生态中，媒体播放功能已成为许多应用的核心组成部分。无论是音乐流媒体应用、视频平台、播客客户端还是游戏应用，都需要强大的媒体播放能力。Android平台提供了丰富的API来支持各种媒体播放场景。本文将全面介绍Android媒体播放的开发技术，从基础到高级功能实现。一、Android媒体播放基础1.1支持的媒体格式Android原生支持多种媒体格式：音频：MP3、AAC、FLAC、W
Android通知(Notification)全面解析：从基础到高级应用
一、Android通知概述通知(Notification)是Android系统中用于在应用之外向用户传递信息的重要机制。当应用需要告知用户某些事件或信息时，可以通过通知在状态栏显示图标，用户下拉通知栏即可查看详细信息。这种机制几乎被所有现代应用采用，用于推送新闻、消息、广告等内容3。与Toast相比，Notification的优势在于：可以长时间停留在通知栏，适合内容较多且需要持久展示的信息支持丰
Android Slices：让应用功能在系统级交互中触手可及安卓开发者 Android Jetpack android 交互 gitee
引言在当今移动应用生态中，用户每天要面对数十个甚至上百个应用的选择，如何让自己的应用在关键时刻触达用户，成为开发者面临的重要挑战。Google在Android9Pie中引入的Slices技术，正是为了解决这一痛点而生。本文将全面介绍AndroidSlices的概念、实现方法、应用场景以及最佳实践，帮助开发者掌握这一提升用户参与度的强大工具。什么是AndroidSlices？AndroidSlice
.net平台的跨平台桌面应用开发的技术方案总结对比 yuanpan .net
目前，.NET平台提供了多种跨平台桌面应用开发的技术方案，主要包括.NETMAUI、AvaloniaUI、UnoPlatform、Eto.Forms等。以下是它们的核心特点及优缺点对比：1..NETMAUI（.NETMulti-platformAppUI）支持平台：Windows、macOS、iOS、Android核心特点：微软官方维护，继承自Xamarin.Forms，支持XAML和C#开发。提
论文阅读：《针对多目标优化和应用的 NSGA-II 综述》一些关于优化算法的简介行然梦实优化算法论文阅读算法数学建模
前言提醒：文章内容为方便作者自己后日复习与查阅而进行的书写与发布，其中引用内容都会使用链接表明出处（如有侵权问题，请及时联系）。其中内容多为一次书写，缺少检查与订正，如有问题或其他拓展及意见建议，欢迎评论区讨论交流。内容由AI辅助生成，仅经笔者审核整理，请甄别食用。文章目录前言一些关于优化算法的缩写优化算法Ma,Haiping&Zhang,Yajing&Sun,Shengyi&Liu,Ting&S
【移动端知识】移动端多 WebView 互访方案：Android、iOS 与鸿蒙实现问道飞鱼前端开发技术 harmonyos android ios 多webview互访
移动端多WebView互访方案：Android、iOS与鸿蒙实现移动端多WebView互访方案：Android、iOS与鸿蒙实现一、核心架构设计二、Android平台实现1.基础通信架构2.控制器实现3.WebView安全配置三、iOS平台实现(Swift)1.WKWebView通信桥接2.AppDelegate路由控制四、鸿蒙平台实现(HarmonyOS)1.WebView通信桥接2.Abili
构建基于Android Studio开发天气预报应用策划加强小乔 Android studio android
AndroidStudio开发天气预报应用需要完成API调用、UI设计、数据解析等步骤。以下是基于OpenWeatherMapAPI的实现方法，包含关键代码片段和详细说明。环境准备与项目创建确保已安装AndroidStudio最新版本，创建新项目选择EmptyActivity模板。在build.gradle模块文件中添加必要依赖：dependencies{implementation'com.sq
Android CameraX 使用指南：简化相机开发安卓开发者 Android Jetpack 数码相机 android
前言在Android开发中，相机功能一直是比较复杂的部分，需要处理不同设备的兼容性、生命周期管理以及复杂的API调用。Google推出的CameraX库极大地简化了这一过程，让开发者能够更轻松地实现高质量的相机功能。本文将带你全面了解CameraX的使用方法。什么是CameraX？CameraX是Jetpack系列中的一个库，它基于Camera2API构建，但提供了更高层次的抽象，具有以下优点：简
ADB 调试神器：从入门到精通的完整指南 AI移动开发前沿 AI移动端开发宝典 adb ai
ADB调试神器：从入门到精通的完整指南关键词：ADB调试、Android开发、设备通信、调试工具、安卓调试桥摘要：ADB（AndroidDebugBridge，安卓调试桥）是安卓开发者和极客玩家的“万能钥匙”——它能让电脑与安卓设备无缝对话，完成安装应用、抓取日志、模拟操作等上百种任务。本文将从“为什么需要ADB”讲起，用“快递系统”“翻译官”等生活化比喻拆解核心原理，配合超详细的操作步骤和实战案
在 Windows 系统下直接使用了 Linux/macOS 的环境变量设置语法 PLATFORM=android
一、报错原因由于开发这个项目的同事，使用电脑的操作系统是macOS。所以才会出现这个错误，因为我是在Windows系统下直接使用了Linux/macOS的环境变量设置语法PLATFORM=android（项目根目录下的package.json文件，找到scripts部分，检查test:android的定义），而Windows不支持这种语法。二、解决方案cross-env是一个解决跨平台环境变量设置
android开发-bug记录 TUZILE android开发 android java android studio bug
2022.01.10正式接触android开发刚三四个月，记录一下三个第一次遇到的bug自定义的圆角控件加载图片导致OOMjava.lang.OutOfMemoryError:Failedtoallocatea373980byteallocationwith288904freebytesand282KBuntilOOM//atdalvik.system.VMRuntime.newNonMovabl
Android布局文件中的xmlns:tools Huang兄 android android
2018-01-04文章目录androidapptoolstools可以干什么ErrorhandlingattributesDesign-timeviewattributes(设计时试图属性)tools:insteadofandroidtools:contexttools:itemCounttools:layouttools:listitem/tools:listheader/tools:list
浅记Android开发中遇到的bug合集 Dream_fan android android java
Android开发中遇到的bug合集（针对自己开发过程中遇到的bug合集记录下来，会持续更新该文章，需要自取，共勉。）文章目录Android开发中遇到的bug合集1.项目编译的过程中遇到"Task‘assembleDebug’notfoundinproject‘:app’."问题。2.使用adbinstall安装apk的时候，设备上已经安装过一个版本，再次安装的话，会安装失败，出现如下提示信息：I
布局管理器android,Android课程---布局管理器之相对布局（一）
下面示例的是在父容器里如何设置按钮的位置，难度：***，重点是找到一个主按钮，设置它的id，然后根据它来设置其他按钮在父容器的位置。代码示例：android:layout_width="match_parent"android:layout_height="match_parent">android:layout_width="wrap_content"android:layout_height=
android开发------编写用户界面之相对布局 cc-Cocos2D-X Android基础
元素之间总是相对于它们的同级元素或父元素进行排列布局。http://www.cnblogs.com/ai-developers/p/android_relativelayout.html
Android 五大布局之线性布局和相对布局 qq_41437225 Android 五大布局之（一）线性布局和相对布局 android 布局线性布局相对布局
Android五大布局之线性布局和相对布局RelativeLayout的相关的属性相对布局第一类：属性值为true和false的：android:layout_centerHrizontal水平居中android:layout_centerVertial垂直居中android:layout_centerInparent相对于父元素完全居中android:layout_alignParentBott
提高android studio 编译速度实用方法 skypiea9
随着项目的规模增加，依赖的的库数量接近三位数。编译一次项目大概等待5-10分钟。还要不要人写代码了。网上找了一些实用的方法，并整理了一下。提高编译速度从三个方面入手：1.项目减肥2.IDE（jvm）配置3.Gradle的几个参数其中最重要的项目减肥。1.1如果是maven中央库没有的项目，可以把该库打包成aar，然后引用：到该库Mudule的build目录下搜*.aar，这个aar可以直接被本地引
Android Studio多Module使用aar编译报错的解决方案 android小菜比
原文链接：AndroidStudio多Module使用aar编译报错的解决方案AARFormat在AndroidStudio之前，如果用引用第三方的库，一般使用jar包，它只包含了class，没有包含对应的资源、so库等，所以引用起来就不方便，特别是一些UI库，第三方在使用的时候，还需要自己单独导入对应的资源（字符串、图片等）。现在Android中引入了aar这种包结构，它其实也是一个zip包，它
Android应用程序UI架构
概述Android系统采用一种称为Surface的UI架构为应用程序提供用户界面。在Android应用程序中，每一个Activity组件都关联有一个或者若干个窗口，每一个窗口都对应有一个Surface。有了这个Surface之后，应用程序就可以在上面渲染窗口的UI。最终这些已经绘制好了的Surface都会被统一提交给Surface管理服务SurfaceFlinger进行合成，最后显示在屏幕上面。无
Android操作系统的UI适配方案研究操作系统内核探秘操作系统内核揭秘 android ui ai
Android操作系统的UI适配方案研究关键词：AndroidUI适配、屏幕密度、分辨率适配、约束布局、多屏幕支持、响应式设计、dp/sp单位摘要：本文深入探讨Android操作系统中的UI适配问题及其解决方案。文章从基础概念入手，分析Android碎片化带来的适配挑战，详细介绍多种适配方案的技术原理和实现方法，包括尺寸单位、布局技术、资源限定符等。通过实际代码示例和数学模型，展示如何构建适应不同
移动开发领域 Android Studio 的语音识别开发 AI移动开发前沿 android studio 语音识别 xcode ai
移动开发领域AndroidStudio的语音识别开发关键词：AndroidStudio、语音识别开发、移动开发、SpeechRecognizer、Google语音识别API摘要：本文聚焦于移动开发领域中使用AndroidStudio进行语音识别开发的相关技术。首先介绍了AndroidStudio语音识别开发的背景，包括目的、预期读者、文档结构和术语表等内容。接着详细阐述了语音识别的核心概念与联系，
音视频流媒体开发【七十四】- WebRTC1-WebRTC入门 AlanGe
音视频流媒体开发-目录iOS知识点-目录Android-目录Flutter-目录数据结构与算法-目录uni-pp-目录1WebRTC入门1.1什么是WebRTCWebRTC（WebRealTimeCommunication）是Google于2010以6829万美元从GlobalIPSolutions公司购买，并于2011年将其开源，旨在建立一个互联网浏览器间的实时通信的平台，让WebRTC技术成为
Android启动时间优化大全 SEP5010 System bootchart cgroup
1修改Androidmksh默认的列长度不修改这个参数，adbshell后，输入超过80个字符，就不能看到完整的命令行。external/mksh/src/sh.hEXTERNmksh_ari_tx_colsE_INIT(80);EXTERNmksh_ari_tx_linsE_INIT(24);2Kernel优化2.1内核驱动模块化将内核中尽可能多的驱动模块化，写一个负责insmod的shell脚
SSM+Vue共享充电宝管理系统充电宝投放管理系统共享充电宝维护管理系统Java 计算机程序老哥
作者主页：计算机毕业设计老哥有问题可以主页问我一、开发介绍1.1开发环境开发语言：Java数据库：MySQL系统架构：B/S后端：SSM(Spring+SpringMVC+Mybatis)前端：Vue工具：IDEA或者Eclipse，JDK1.8，Maven二、系统介绍2.1图片展示注册登录页面：登陆前端页面功能：首页、合作商户、充电宝投放、公告栏、个人中心、后台管理首页.png充电宝投放.png
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc