2021-06-30

FFmpeg X264编码参数

码率控制 1

X264的preset和tune 2

编码延时建议 2

ffmpeg编码参数和x264参数对照 3

x264参数说明 5

2.码率控制

X264提供三种码率控制的方式：bitrate, qp, crf。这三种方式是互斥的，使用时设置其中之一即可。

（1）bitrate

x264会尝试把给定的位元率作为整体平均值来编码。这意味着最终编码文件的大小是已知的，但最终的品质未知。此选项通常与-pass（两阶段编码）一起使用。

注意，ffmpeg中设置bitrate的具体参数为bit_rate，单位是bits/s（x264里面对应参数i_bitrate的单位则是kbits/s, 1kbits为1000bits而非1024bits）.

（2）qp

使用qp选项时，表示P帧的量化值为qp。I帧和B帧的量化值则是从--ipratio和--pbratio中取得。可使用默认参数，也可自己设定。使用qp模式，即固定量化值，意味着停用弹性量化（aq_mode）。

当qp为0时，为无损编码。

（3）crf

固定位元率系数，Constant Ratefactor，

可用的值从1到51，越小编码质量越好，码率越高。一般使用16到24，可以为浮点。(crf并不是恒定质量的方式，同一片子同一crf值，其他参数不同可能码率和质量差较大，不同的片子之间就更没有可比性了)

此模式把某个“质量”作为编码目标，根据片子质量自动分配码率的vbr（Variable Bit Rate动态比特率）。X264中构想是让crf n提供与qp n相当的视觉品质，但编码文件更小一些。

CRF是借由降低“较不重要”帧的品质来达到此目的。在此情况下，“较不重要”是指在复杂或高动态场景的帧，其品质不是很耗费位元数就是不易察觉，所以会提高它们的量化值。从这些帧里所节省下来的位元数被重新分配到可以更有效利用的帧。

当crf为0时，与qp 0相同，实现无损编码。

3.X264的preset和tune

鉴于x264的参数众多，各种参数的配合复杂，为了使用者方便，x264建议如无特别需要可使用preset和tune设置。这套开发者推荐的参数较为合理，可在此基础上在调整一些具体参数以符合自己需要，手动设定的参数会覆盖preset和tune里的参数。

--preset的参数主要调节编码速度和质量的平衡，有ultrafast、superfast、veryfast、faster、fast、medium、slow、slower、veryslow、placebo这10个选项，从快到慢。

--tune的参数主要配合视频类型和视觉优化的参数，或特别的情况。如果视频的内容符合其中一个可用的调整值又或者有其中需要，则可以使用此选项，否则建议不使用（如tune grain是为高比特率的编码而设计的）。tune的值有：

film：电影、真人类型；

animation：动画；

grain：需要保留大量的grain时用；

stillimage：静态图像编码时使用；

psnr：为提高psnr做了优化的参数；

ssim：为提高ssim做了优化的参数；

fastdecode：可以快速解码的参数；

zerolatency：零延迟，用在需要非常低的延迟的情况下，比如电视电话会议的编码。

4.一些编码建议

编码延时

降低x264的延时是可能的，但是会降低质量。若需零延时，设置--tune zerolatency。若你可以接受一点儿小延时(如小于1秒)，最好还是允许延时。下列步骤可以降低延迟，当延迟足够小时，就别再进行后续步骤了：

1.从初始值开始

2.关闭sync-lookahead(设置用于线程预测的帧缓存大小。最大值是250.在第二遍及更多遍编码或基于分片线程时自动关闭)

3.降低rc-lookahead，但别小于10(设定mb-tree位元率控制和vbv-lookahead使用的帧数)

4.降低threads(比如从12降到6)

5.使用切片线程(sliced threads)

6.禁用rc-lookahead

7.禁用b-frames

8.实在不行，就用--tune zerolatency

param->rc.i_lookahead = 0;param->i_sync_lookahead = 0; param->i_bframe = 0; param->b_sliced_threads = 1; param->b_vfr_input = 0;param->rc.b_mb_tree = 0;(使用宏块树位元率控制会改善整体压缩率)

x264线程

x264起多少个线程比较好？

建议线程数：

1、2、4、8

测试结论：

1、更多的线程会消耗更多总CPU时间片，因此在长期满载的机器上不宜使用多线程。

2、获得的时间收益随线程增多呈递减趋势，8线程以后尤为明显。

3、PNSR下降随线程数增加呈抛物递增趋势，16线程增加到24线程PSNR时下降了0.6之巨。

4、设置threads=auto时，线程数为逻辑CPU个数的1.5倍。

x264各类型帧的大小及编码耗时

注：作参考，未必属实。

I帧、B帧、P帧都极大地受编码参数的影响。

通常情况下：

h264编码的帧由大到小依次为：

I > P > B

（互相之间约有5倍的差距）

x264的编码耗时由长到短依次为：

P > B > I

通常而言，较小的帧因为帧内压缩计算量(deblock、cabac等)小，所以耗时相对短。

P帧的编码耗时长是因为帧间压缩(宏块寻找、运动补偿等)耗时长所以提高了总体耗时。

另外：可以修改x264中的x264_slices_write函数来测量不同类型帧的编码耗时。

5.ffmpeg编码参数和x264参数对照

下面表中涉及的参数直接在AVCodecContext结构中设置：

FFmpeg option x264 option

Code Console Console Code

gop_size -g –keyint i_keyint_max

bit_rate -b –bitrate rc.i_bitrate

rc_buffer_size -bufsize –vbv-bufsize rc.i_vbv_buffer_size

rc_max_rate -maxrate –vbv-maxrate rc.i_vbv_max_bitrate

max_b_frames -bf –bframes i_bframe

keyint_min -keyint_min –min-keyint i_keyint_min

scenechange_threshold -sc_threshold –scenecut i_scenecut_threshold

qmin -qmin –qpmin rc.i_qp_min

qmax -qmax –qpmax rc.i_qp_max

max_qdiff -qdiff –qpstep rc.i_qp_step

qcompress -qcomp –qcomp rc.f_qcompress

qblur -qblur –qblur rc.f_qblur

Refs -refs –ref i_frame_reference

me_method -me_method –me analyse.i_me_method

merange -me_range –merange analyse.i_me_range

me_subpel_quality -subq –subme analyse.i_subpel_refine

trellis -trellis <0,1,2> –trellis analyse.i_trellis

noise_reduction -nr –nr analyse.i_noise_reduction

level -level –level i_level_idc

bit_rate_tolerance

-bt –ratetol = -bt / -b rc.f_rate_tolerance

rc_initial_buffer_occupancy -rc_init_occupancy –vbv-init = -rc_init_occupancy / -bufsize rc.f_vbv_buffer_init

b_quant_factor -b_qfactor –pbratio rc.f_pb_factor

chromaoffset -chromaoffset –chroma-qp-offset analyse.i_chroma_qp_offset

thread_count -threads –threads i_threads

me_cmp -cmp <-chroma/+chroma> chroma-me analyse.b_chroma_me

thread_type thread_type sliced_threads b_sliced_threads

AVCodecContext结构中priv_data可设置的参数见下表：

priv_data(即X264Context option)

preset

tune

profile

fastfirstpass

level

stats

wpredp

x264opts

crf

crf_max

cqp

aq_mode

aq_strength

psy

psy_rd

rc_lookahead

weightb

weightp

ssim

intra_refresh

b_bias

b_pyramid

mixed_refs

dct8x8

fast_pskip

aud

mbtree

deblock

cplxblur

partitions

direct_pred

slice_max_size

stats

nal_hrd

x264_params

其余x264参数设置，见下面格式，多个参数用冒号(:)隔开：

av_opt_set(AVCodecContext->priv_data, "x264opts", "sync-lookahead=0: sliced-threads", 0);

6.x264参数说明

注：下面说明不是最新版本，最新版本请参考x264 --fullhelp

预设

为了减少使用者花费时间和精力在命令列上而设计的一套系统。这些设定切换了什么选项可以从x264 --fullhelp的说明里得知。

profile

预设值：无

限制输出资料流的profile。如果指定了profile，它会覆写所有其他的设定。所以如果指定了profile，将会保证得到一个相容的资料流。如果设了此选项，将会无法使用无失真（lossless）编码（--qp 0或--crf 0）。

如果播放装置仅支援某个profile，则应该设此选项。大多数解码器都支援High profile，所以没有设定的必要。

可用的值：baseline, main, high

preset

预设值：medium

变更选项，以权衡压缩效率和编码速度。如果指定了预设，变更的选项将会在套用所有其他的参数之前套用。

通常应该将此设为所能忍受的最慢一个选项。

可用的值：ultrafast, superfast, veryfast, faster, fast, medium, slow, slower, veryslow, placebo

ultrafast

--no-8x8dct --aq-mode 0 --b-adapt 0

--bframes 0 --no-cabac --no-deblock

--no-mbtree --me dia --no-mixed-refs

--partitions none --rc-lookahead 0 --ref 1

--scenecut 0 --subme 0 --trellis 0

--no-weightb --weightp 0

Superfast

--no-mbtree --me dia --no-mixed-refs

--partitions i8x8,i4x4 --rc-lookahead 0 --ref 1

--subme 1 --trellis 0 --weightp 1

param->analyse.inter = X264_ANALYSE_I8x8|X264_ANALYSE_I4x4;

param->analyse.i_me_method = X264_ME_DIA;

param->analyse.i_subpel_refine = 1;

param->i_frame_reference = 1;

param->analyse.b_mixed_references = 0;

param->analyse.i_trellis = 0;

param->rc.b_mb_tree = 0;

param->analyse.i_weighted_pred = X264_WEIGHTP_SIMPLE;

param->rc.i_lookahead = 0;

tune

预设值：无

调整选项，以进一步最佳化为视讯的内容。如果指定了tune，变更的选项将会在--preset之后，但所有其他的参数之前套用。

如果视讯的内容符合其中一个可用的调整值，则可以使用此选项，否则不要使用。

可用的值：film, animation, grain, stillimage, psnr, ssim, fastdecode, zerolatency

slow-firstpass

预设值：无

使用--pass 1会在解析命令列的最后套用以下设定：

--ref 1

--no-8x8dct

--partitions i4x4 （如果最初有启用，否则为无）

--me dia

--subme MIN(2, subme)

--trellis 0

可以使用--slow-firstpass来停用此功能。注意，使用--preset placebo也会启用slow-firstpass。

参阅：--pass

帧类型选项

keyint

预设值：250

设定x264输出的资料流之最大IDR帧（亦称为关键帧）间隔。可以指定infinite让x264永远不要插入非场景变更的IDR帧。

IDR帧是资料流的“分隔符号”，所有帧都无法从IDR帧的另一边参照资料。因此，IDR帧也是I帧，所以它们不从任何其他帧参照资料。这意味着它们可以用作视讯的搜寻点（seek points）。

注意，I帧通常明显大于P/B帧（在低动态场景通常为10倍大或更多），所以当它们与极低的VBV设定合并使用时会打乱位元率控制。在这些情况下，研究--intra-refresh。

预设值对于大多数视讯没啥问题。在为蓝光、广播、即时资料流或某些其他特殊情况编码时，可能需要更小的GOP长度（通常等于帧率）。

参阅：--min-keyint, --scenecut, --intra-refresh

min-keyint

预设值：自动（MIN(--keyint / 10, --fps)）

设定IDR帧之间的最小长度。

IDR帧的说明可以参阅--keyint。过小的keyint范围会导致“不正确的”IDR帧位置（例如闪屏场景）。此选项限制在每个IDR帧之后，要有多少帧才可以再有另一个IDR帧的最小长度。

min-keyint的最大允许值是--keyint/2+1。

建议：预设值，或者等于帧率

参阅：--keyint, --scenecut

no-scenecut

预设值：无

完全停用弹性I帧决策（adaptive I-frame decision）。

参阅：--scenecut

scenecut

预设值：40

设定I/IDR帧位置的阈值（场景变更侦测）。

x264为每一帧计算一个度量值，来估计与前一帧的不同程度。如果该值低于scenecut，则算侦测到一个“场景变更”。如果此时与最近一个IDR帧的距离低于--min-keyint，则放置一个I帧，否则放置一个IDR帧。越大的scenecut值会增加侦测到场景变更的数目。场景变更是如何比较的详细资讯可以参阅http://forum.doom9.org/showthread.php?t=121116。

将scenecut设为0相当于设定--no-scenecut。

建议：预设值

参阅：--keyint, --min-keyint, --no-scenecut

intra-refresh

预设值：无

停用IDR帧，作为替代x264会为每隔--keyint的帧的每个巨集区块（macroblock）使用内部编码（intra coding）。区块是以一个水平卷动的行刷新，称为刷新波（refresh wave）。这有利于低延迟的资料流，使它有可能比标准的IDR帧达到更加固定的帧大小。它也增强了视讯资料流对封包遗失的恢复能力。此选项会降低压缩效率，因此必要时才使用。

有趣的事：

第一帧仍然是IDR帧。

内部区块（Intra-blocks）仅处于P帧里，刷新波在一或多个B帧后的第一个P帧更广泛。

压缩效率的损失主要来自于在刷新波上左侧（新）的巨集区块无法参照右侧（旧）的资料。

bframes

预设值：3

设定x264可以使用的最大并行B帧数。

没有B帧时，一个典型的x264资料流有着像这样的帧类型：IPPPPP...PI。当设了--bframes 2时，最多两个连续的P帧可以被B帧取代，就像：IBPBBPBPPPB...PI。

B帧类似于P帧，除了B帧还能从它之后的帧做动态预测（motion prediction）。就压缩比来说效率会大幅提高。它们的平均品质是由--pbratio所控制。

有趣的事：

x264还区分两种不同种类的B帧。"B"是代表一个被其他帧作为参照帧的B帧（参阅--b-pyramid），而"b"则代表一个不被其他帧作为参照帧的B帧。如果看到一段混合的"B"和"b"，原因通常与上述有关。当差别并不重要时，通常就以"B"代表所有B帧。

x264是如何为每个候选帧选定为P帧或B帧的详细资讯可以参阅http://article.gmane.org/gmane.comp.video.ffmpeg.devel/29064。在此情况下，帧类型看起来会像这样（假设--bframes 3）：IBBBPBBBPBPI。

参阅：--b-bias, --b-pyramid, --ref, --pbratio, --partitions, --weightb

b-adapt

预设值：1

设定弹性B帧位置决策演算法。此设定控制x264如何决定要放置P帧或B帧。

0：停用，总是挑选B帧。这与旧的no-b-adapt设定相同作用。

1：“快速”演算法，较快，越大的--bframes值会稍微提高速度。当使用此模式时，基本上建议搭配--bframes 16使用。

2：“最佳”演算法，较慢，越大的--bframes值会大幅降低速度。

注意：对于多重阶段（multi-pass）编码，仅在第一阶段（first pass）才需要此选项，因为帧类型在此时已经决定完了。

b-bias

预设值：0

控制使用B帧而不使用P帧的可能性。大于0的值增加偏向B帧的加权，而小于0的值则相反。范围是从-100到100。100并不保证全是B帧（要全是B帧该使用--b-adapt 0），而-100也不保证全是P帧。

仅在你认为能比x264做出更好的位元率控制决策时才使用此选项。

参阅：--bframes, --ipratio

b-pyramid

预设值：normal

允许B帧作为其他帧的参照帧。没有此设定时，帧只能参照I/P帧。虽然I/P帧因其较高的品质作为参照帧更有价值，但B帧也是很有用的。作为参照帧的B帧会得到一个介于P帧和普通B帧之间的量化值。b-pyramid需要至少两个以上的--bframes才会运作。

如果是在为蓝光编码，须使用none或strict。

none：不允许B帧作为参照帧。

strict：每minigop允许一个B帧作为参照帧，这是蓝光标准强制执行的限制。

normal：每minigop允许多个B帧作为参照帧。

参阅：--bframes, --refs, --no-mixed-refs

open-gop

预设值：none

open-gop是一个提高效率的编码技术。有三种模式：

none：停用open-gop。

normal：启用open-gop。

bluray：启用open-gop。一个效率较低的open-gop版本，因为normal模式无法用于蓝光编码。

某些解码器不完全支援open-gop资料流，这就是为什么此选项并未预设为启用。如果想启用open-gop，应该先测试所有可能用来拨放的解码器。

open-gop的说明可以参阅http://forum.doom9.org/showthread.php?p=1300124#post1300124。

no-cabac

预设值：无

停用弹性内容的二进位算数编码（CABAC：Context Adaptive Binary Arithmetic Coder）资料流压缩，切换回效率较低的弹性内容的可变长度编码（CAVLC：Context Adaptive Variable Length Coder）系统。大幅降低压缩效率（通常10~20%）和解码的硬体需求。

ref

预设值：3

控制解码图片缓冲（DPB：Decoded Picture Buffer）的大小。范围是从0到16。总之，此值是每个P帧可以使用先前多少帧作为参照帧的数目（B帧可以使用的数目要少一或两个，取决于它们是否作为参照帧）。可以被参照的最小ref数是1。

还要注意的是，H.264规格限制了每个level的DPB大小。如果遵守Level 4.1规格，720p和1080p视讯的最大ref数分别是9和4。

参阅：--b-pyramid, --no-mixed-refs, --level

no-deblock

预设值：无

完全停用循环筛选（loop filter）。不建议。

参阅：--deblock

deblock

预设值：0:0

控制循环筛选（亦称为持续循环去区块(inloop deblocker)），这是H.264标准的一部分。就性价比来说非常有效率。

可以在http://forum.doom9.org/showthread.php?t=109747找到loop滤镜的参数是如何运作的说明（参阅第一个帖子和akupenguin的回复）。

参阅：--no-deblock

slices

预设值：无

设定每帧的切片数，而且强制为矩形切片（会被--slice-max-size或--slice-max-mbs覆写）。

如果是在为蓝光编码，将值设为4。否则，不要使用此选项，除非你知道真的有必要。

参阅：--slice-max-size, --slice-max-mbs

slice-max-size

预设值：无

设定最大的切片大小（单位是位元组），包括估计的NAL额外负荷（overhead）。（目前与--interlaced不相容）

参阅：--slices

slice-max-mbs

预设值：无

设定最大的切片大小（单位是巨集区块）。（目前与--interlaced不相容）

参阅：--slices

tff

预设值：无

启用交错式编码并指定顶场优先（top field first）。x264的交错式编码使用MBAFF，本身效率比渐进式编码差。出于此原因，仅在打算于交错式显示器上播放视讯时，才应该编码为交错式（或者视讯在送给x264之前无法进行去交错）。此选项会自动启用--pic-struct。

bff

预设值：无

启用交错式编码并指定底场优先（bottom field first）。详细资讯可以参阅--tff。

constrained-intra

预设值：无

启用限制的内部预测（constrained intra prediction），这是SVC编码的基础层（base layer）所需要的。既然EveryoneTM忽略SVC，你同样可以忽略此选项。

pulldown

预设值：none

使用其中一个预设模式将渐进式、固定帧率的输入资料流标志上软胶卷过带（soft telecine）。软胶卷过带在http://trac.handbrake.fr/wiki/Telecine有更详细的解释。

可用的预设：none, 22, 32, 64, double, triple, euro

指定除了none以外的任一模式会自动启用--pic-struct。

fake-interlaced

预设值：无

将资料流标记为交错式，即使它并未以交错式来编码。用于编码25p和30p为符合蓝光标准的视讯。

frame-packing

预设值：无

如果在编码3D视讯，此参数设定一个位元资料流（bitstream）旗标，用来告诉解码器3D视讯是如何被封装。相关的值和它们的意义可以从x264 --fullhelp的说明里得知。

位元率控制

预设值：无

三种位元率控制方法之一。设定x264以固定量化值（Constant Quantizer）模式来编码视讯。这里给的值是指定P帧的量化值。I帧和B帧的量化值则是从--ipratio和--pbratio中取得。CQ模式把某个量化值作为目标，这意味着最终档案大小是未知的（虽然可以透过一些方法来准确地估计）。将值设为0会产生无失真输出。对于相同视觉品质，qp会比--crf产生更大的档案。qp模式也会停用弹性量化，因为按照定义“固定量化值”意味着没有弹性量化。

此选项与--bitrate和--crf互斥。各种位元率控制系统的详细资讯可以参阅http://git.videolan.org/?p=x264.git;a=blob_plain;f=doc/ratecontrol.txt;hb=HEAD。

虽然qp不需要lookahead来执行因此速度较快，但通常应该改用--crf。

参阅：--bitrate, --crf, --ipratio, --pbratio

bitrate

预设值：无

三种位元率控制方法之二。以目标位元率模式来编码视讯。目标位元率模式意味着最终档案大小是已知的，但最终品质则未知。x264会尝试把给定的位元率作为整体平均值来编码视讯。参数的单位是千位元/秒（8位元=1位元组）。注意，1千位元(kilobit)是1000位元，而不是1024位元。

此设定通常与--pass在两阶段（two-pass）编码一起使用。

此选项与--qp和--crf互斥。各种位元率控制系统的详细资讯可以参阅http://git.videolan.org/?p=x264.git;a=blob_plain;f=doc/ratecontrol.txt;hb=HEAD。

参阅：--qp, --crf, --ratetol, --pass, --stats

crf

预设值：23.0

最后一种位元率控制方法：固定位元率系数（Constant Ratefactor）。当qp是把某个量化值作为目标，而bitrate是把某个档案大小作为目标时，crf则是把某个“品质”作为目标。构想是让crf n提供的视觉品质与qp n相同，只是档案更小一点。crf值的度量单位是“位元率系数（ratefactor）”。

CRF是借由降低“较不重要”的帧之品质来达到此目的。在此情况下，“较不重要”是指在复杂或高动态场景的帧，其品质不是很耗费位元数就是不易察觉，所以会提高它们的量化值。从这些帧里所节省下来的位元数被重新分配到可以更有效利用的帧。

CRF花费的时间会比两阶段编码少，因为两阶段编码中的“第一阶段”被略过了。另一方面，要预测CRF编码的最终位元率是不可能的。根据情况哪种位元率控制模式更好是由你来决定。

此选项与--qp和--bitrate互斥。各种位元率控制系统的详细资讯可以参阅http://git.videolan.org/?p=x264.git;a=blob_plain;f=doc/ratecontrol.txt;hb=HEAD。

参阅：--qp, --bitrate

rc-lookahead

预设值：40

设定mb-tree位元率控制和vbv-lookahead使用的帧数。最大允许值是250。

对于mb-tree部分，增加帧数带来更好的效果但也会更慢。mb-tree使用的最大缓冲值是MIN(rc-lookahead, --keyint)。

对于vbv-lookahead部分，当使用vbv时，增加帧数带来更好的稳定性和准确度。vbv-lookahead使用的最大值是：

MIN(rc-lookahead, MAX(--keyint, MAX(--vbv-maxrate, --bitrate) / --vbv-bufsize * --fps))

参阅：--no-mbtree, --vbv-bufsize, --vbv-maxrate

什么是Macroblock Tree

Macroblock Tree是一个基于macroblock的qp控制方法。MB Tree的工作原理类似于古典的qp compression，只不过qcomp处理的对象是整张frame而MB Tree针对的是每个MB进行处理。工作过程简单来说，是对于每个MB，向前预测一定数量的帧（该数量由rc-lookahead和keyint的较小值决定）中该MB被参考的情况，根据引用次数的多寡，决定对该MB使用何种大小的qp进行quantization。而qp的大小与被参考次数成反比，也就是说，对于被参考次数多的MB，264的解码器认为此对应于缓慢变化的场景，因此给与比较高的质量（比较低的qp数值）。至于视频的变化率与人眼感知能力的关系，这是一个基于主观测试的经验结果：视频变化率越大人眼的敏感度越低，也就是说，人眼可以容忍快速变化场景的某些缺陷，但相对而言某些平滑场景的缺陷，人眼则相当敏感。注意此处说的平滑，指的是沿时间维度上场景的变化频率，而非普通意义上的像素域中的场景。

vbv-maxrate

预设值：0

设定重新填满VBV缓冲的最大位元率。

VBV会降低品质，所以必要时才使用。

参阅：--vbv-bufsize, --vbv-init, VBV编码建议

vbv-bufsize

预设值：0

设定VBV缓冲的大小（单位是千位元）。

VBV会降低品质，所以必要时才使用。

参阅：--vbv-maxsize, --vbv-init, VBV编码建议

vbv-init

预设值：0.9

设定VBV缓冲必须填满多少才会开始播放。

如果值小于1，初始的填满量是：vbv-init * vbv-bufsize。否则该值即是初始的填满量（单位是千位元）。

参阅：--vbv-maxsize, --vbv-bufsize, VBV编码建议

crf-max

预设值：无

一个类似--qpmax的设定，除了指定的是最大位元率系数而非最大量化值。当使用--crf且启用VBV时，此选项才会运作。它阻止x264降低位元率系数（亦称为“品质”）到低于给定的值，即使这样做会违反VBV的条件约束。此设定主要适用于自订资料流伺服器。详细资讯可以参阅http://git.videolan.org/gitweb.cgi/x264.git/?a=commit;h=81eee062a4ce9aae1eceb3befcae855c25e5ec52。

参阅：--crf, --vbv-maxrate, --vbv-bufsize

qpmin

预设值：0

定义x264可以使用的最小量化值。量化值越小，输出就越接近输入。到了一定的值，x264的输出看起来会跟输入一样，即使它并不完全相同。通常没有理由允许x264花费比这更多的位元数在任何特定的巨集区块上。

当弹性量化启用时（预设启用），不建议提高qpmin，因为这会降低帧里面平面背景区域的品质。

参阅：--qpmax, --ipratio

关于qpmin的预设值：在x264 r1795版本之前，该选项预设值为10。

qpmax

预设值：51

定义x264可以使用的最大量化值。预设值51是H.264规格可供使用的最大量化值，而且品质极低。此预设值有效地停用了qpmax。如果想要限制x264可以输出的最低品质，可以将此值设小一点（通常30~40），但通常并不建议调整此值。

参阅：--qpmin, --pbratio, --crf-max

qpstep

预设值：4

设定两帧之间量化值的最大变更幅度。

ratetol

预设值：1.0

此参数有两个目的：

在一阶段位元率编码时，此设定控制x264可以偏离目标平均位元率的百分比。可以指定inf来完全停用溢出侦测（overflow detection）。可以设定的最小值是0.01。值设得越大，x264可以对接近电影结尾的复杂场景作出越好的反应。此目的的度量单位是百分比（例如，1.0等于允许1%的位元率偏差）。

很多电影（例如动作片）在电影结尾时是最复杂的。因为一阶段编码并不知道这一点，结尾所需的位元数通常被低估。将ratetol设为inf可以减轻此情况，借由允许编码以更像--crf的模式运行，但档案大小会暴增。

当VBV启用时（即指定了--vbv-开头的选项），此设定也会影响VBV的强度。值设得越大，允许VBV在冒着可能违反VBV设定的风险下有越大的波动。

ipratio

预设值：1.40

修改I帧量化值相比P帧量化值的目标平均增量。越大的值会提高I帧的品质。

参阅：--pbratio

pbratio

预设值：1.30

修改B帧量化值相比P帧量化值的目标平均减量。越大的值会降低B帧的品质。当mbtree启用时（预设启用），此设定无作用，mbtree会自动计算最佳值。

参阅：--ipratio

chroma-qp-offset

预设值：0

在编码时增加色度平面量化值的偏移。偏移可以为负数。

当使用psy-rd或psy-trellis时，x264自动降低此值来提高亮度的品质，其后降低色度的品质。这些设定的预设值会使chroma-qp-offset再减去2。

注意：x264仅在同一量化值编码亮度平面和色度平面，直到量化值29。在此之后，色度逐步以比亮度低的量被量化，直到亮度在q51和色度在q39为止。此行为是由H.264标准所要求。

aq-mode

预设值：1

弹性量化模式。没有AQ时，x264很容易分配不足的位元数到细节较少的部分。AQ是用来更好地分配视讯里所有巨集区块之间的可用位元数。此设定变更AQ会重新分配位元数到什么范围里：

0：完全不使用AQ。

1：允许AQ重新分配位元数到整个视讯和帧内。

2：自动变化（Auto-variance）AQ，会尝试对每帧调整强度。（实验性的）

参阅：--aq-strength

aq-strength

预设值：1.0

弹性量化强度。设定AQ偏向低细节（平面）的巨集区块之强度。不允许为负数。0.0~2.0以外的值不建议。

参阅：--aq-mode

pass

预设值：无

此为两阶段编码的一个重要设定。它控制x264如何处理--stats档案。有三种设定：

1：建立一个新的统计资料档案。在第一阶段使用此选项。

2：读取统计资料档案。在最终阶段使用此选项。

3：读取统计资料档案并更新。

统计资料档案包含每个输入帧的资讯，可以输入到x264以改善输出。构想是执行第一阶段来产生统计资料档案，然后第二阶段将建立一个最佳化的视讯编码。改善的地方主要是从更好的位元率控制中获益。

参阅：--stats, --bitrate, --slow-firstpass, X264统计资料档案

stats

预设值："x264_2pass.log"

设定x264读取和写入统计资料档案的位置。

参阅：--pass, X264统计资料档案

no-mbtree

预设值：无

停用巨集区块树（macroblock tree）位元率控制。使用巨集区块树位元率控制会改善整体压缩率，借由追踪跨帧的时间传播（temporal propagation）并相应地加权。除了已经存在的统计资料档案之外，多重阶段编码还需要一个新的统计资料档案。

建议：预设值

参阅：--rc-lookahead

qcomp

预设值：0.60

量化值曲线压缩系数。0.0是固定位元率，1.0则是固定量化值。

当mbtree启用时，它会影响mbtree的强度（qcomp越大，mbtree越弱）。

建议：预设值

参阅：--cplxblur, --qblur

cplxblur

预设值：20.0

以给定的半径范围套用高斯模糊（gaussian blur）于量化值曲线。这意味着分配给每个帧的量化值会被它的邻近帧模糊掉，以此来限制量化值波动。

参阅：--qcomp, --qblur

qblur

预设值：0.5

在曲线压缩之后，以给定的半径范围套用高斯模糊于量化值曲线。不怎么重要的设定。

参阅：--qcomp, --cplxblur

zones

预设值：无

调整视讯的特定片段之设定。可以修改每区段的大多数x264选项。

一个单一区段的形式为<起始帧>,<结束帧>,<选项>。

多个区段彼此以"/"分隔。

选项：

这两个是特殊选项。每区段只能设定其中一个，而且如果有设定其中一个，它必须为该区段列出的第一个选项：

b=<浮点数> 套用位元率乘数在此区段。在额外调整高动态和低动态场景时很有用。

q=<整数> 套用固定量化值在此区段。在套用于一段范围的帧时很有用。

其他可用的选项如下：

ref=<整数>

b-bias=<整数>

scenecut=<整数>

no-deblock

deblock=<整数>:<整数>

deadzone-intra=<整数>

deadzone-inter=<整数>

direct=<字串>

merange=<整数>

nr=<整数>

subme=<整数>

trellis=<整数>

(no-)chroma-me

(no-)dct-decimate

(no-)fast-pskip

(no-)mixed-refs

psy-rd=<浮点数>:<浮点数>

me=<字串>

no-8x8dct

b-pyramid=<字串>

限制：

一个区段的参照帧数无法超过--ref所指定的大小。

无法开启或关闭scenecut；如果--scenecut最初为开启（>0），则只能改变scenecut的大小。

如果使用--me esa/tesa，merange无法超过最初所指定的大小。

如果--subme最初指定为0，则无法变更subme。

如果--me最初指定为dia、hex或umh，则无法将me设为esa为tesa。

范例：0,1000,b=2/1001,2000,q=20,me=3,b-bias=-1000

建议：预设值

qpfile

预设值：无

手动覆写标准的位元率控制。指定一个档案，为指定的帧赋予量化值和帧类型。格式为“帧号帧类型量化值”。例如：

0 I 18 < IDR (key) I-frame

1 P 18 < P-frame

2 B 18 < Referenced B-frame

3 i 18 < Non-IDR (non-key) I-frame

4 b 18 < Non-referenced B-frame

5 K 18 < Keyframe*

不需要指定每个帧。

使用-1作为所需的量化值允许x264自行选择最佳的量化值，在只需设定帧类型时很有用。

在指定了大量的帧类型和量化值时仍然让x264间歇地自行选择，会降低x264的效能。

"Keyframe"是一个泛用关键帧／搜寻点，如果--open-gop是none则等同于一个IDR I帧，否则等同于一个加上Recovery Point SEI旗标的Non-IDR I帧。

分析

partitions

预设值：p8x8,b8x8,i8x8,i4x4

H.264视讯在压缩过程中划分为16x16的巨集区块。这些区块可以进一步划分为更小的分割，这就是此选项要控制的部分。

此选项可以启用个别分割。分割依不同帧类型启用。

可用的分割：p8x8, p4x4, b8x8, i8x8, i4x4, none, all

I：i8x8、i4x4。

P：p8x8（也会启用p16x8/p8x16）、p4x4（也会启用p8x4/p4x8）。

B：b8x8（也会启用b16x8/b8x16）。

p4x4通常不怎么有用，而且性价比极低。

参阅：--no-8x8dct

direct

预设值：spatial

设定"direct"动态向量（motion vectors）的预测模式。有两种模式可用：spatial和temporal。可以指定none来停用direct动态向量，和指定auto来允许x264在两者之间切换为适合的模式。如果设为auto，x264会在编码结束时输出使用情况的资讯。auto最适合用于两阶段编码，但也可用于一阶段编码。在第一阶段auto模式，x264持续记录每个方法执行到目前为止的好坏，并从该记录挑选下一个预测模式。注意，仅在第一阶段有指定auto时，才应该在第二阶段指定auto；如果第一阶段不是指定auto，第二阶段将会预设为temporal。none模式会浪费位元数，因此强烈不建议。

建议：auto

no-weightb

预设值：无

H.264允许“加权”B帧的参照，它允许变更每个参照影响预测图片的程度。此选项停用该功能。

建议：预设值

weightp

预设值：2

使x264能够使用明确加权预测（explicit weighted prediction）来改善P帧的压缩。亦改善淡入／淡出的品质。模式越高越慢。

注意：在为Adobe Flash编码时，将值设为1，否则它的解码器会产生不自然痕迹（artifacts）。Flash 10.1修正了此bug。

模式：

0：停用。

1：简易：分析淡入／淡出，但不分析重复参照帧。

2：智慧：分析淡入／淡出和重复参照帧。

预设值：hex

设定全像素（full-pixel）动态估算（motion estimation）的方法。有五个选项：

dia（diamond）：最简单的搜寻方法，起始于最佳预测器（predictor），检查上、左、下、右方一个像素的动态向量，挑选其中最好的一个，并重复此过程直到它不再找到任何更好的动态向量为止。

hex（hexagon）：由类似策略组成，除了它使用周围6点范围为2的搜寻，因此叫做六边形。它比dia更有效率且几乎没有变慢，因此作为一般用途的编码是个不错的选择。

umh（uneven multi-hex）：比hex更慢，但搜寻复杂的多六边形图样以避免遗漏难以找到的动态向量。不像hex和dia，merange参数直接控制umh的搜寻半径，允许增加或减少广域搜寻的大小。

esa（exhaustive）：一种在merange内整个动态搜寻空间的高度最佳化智慧搜寻。虽然速度较快，但数学上相当于搜寻该区域每个单一动态向量的暴力（bruteforce）方法。不过，它仍然比UMH还要慢，而且没有带来很大的好处，所以对于日常的编码不是特别有用。

tesa（transformed exhaustive）：一种尝试接近在每个动态向量执行Hadamard转换法比较的效果之演算法，就像exhaustive，但效果好一点而速度慢一点。

参阅：--merange

merange

预设值：16

merange控制动态搜寻的最大范围（单位是像素）。对于hex和dia，范围限制在4~16。对于umh和esa，它可以增加到超过预设值16来允许范围更广的动态搜寻，对于HD视讯和高动态镜头很有用。注意，对于umh、esa和tesa，增加merange会大幅减慢编码速度。

参阅：--me

mvrange

预设值：-1 （自动）

设定动态向量的最大（垂直）范围（单位是像素）。预设值依level不同：

Level 1/1b：64。

Level 1.1~2.0：128。

Level 2.1~3.0：256。

Level 3.1+：512。

注意：如果想要手动覆写mvrange，在设定时从上述值减去0.25（例如--mvrange 127.75）。

建议：预设值

mvrange-thread

预设值：-1 （自动）

设定执行绪之间的最小动态向量缓冲。不要碰它。

建议：预设值

subme

预设值：7

设定子像素（subpixel）估算复杂度。值越高越好。层级1~5只是控制子像素细分（refinement）强度。层级6为模式决策启用RDO，而层级8为动态向量和内部预测模式启用RDO。RDO层级明显慢于先前的层级。

使用小于2的值不但会启用较快且品质较低的lookahead模式，而且导致较差的--scenecut决策，因此不建议。

可用的值：

0：Fullpel only

1：QPel SAD 1 iteration

2：QPel SATD 2 iterations

3：HPel on MB then QPel

4：Always QPel

5：Multi QPel + bi-directional motion estimation

6：RD on I/P frames

7：RD on all frames

8：RD refinement on I/P frames

9：RD refinement on all frames

10：QP-RD (requires --trellis=2, --aq-mode>0)

建议：预设值，或者更高，除非速度非常重要

psy-rd

预设值：1.0:0.0

第一个数是Psy-RDO的强度（需要subme>=6）。第二个数是Psy-Trellis的强度（需要trellis>=1）。注意，Trellis仍然被视为“实验性的”，而且几乎可以肯定至少卡通不适合使用。

psy-rd的解释可以参阅http://forum.doom9.org/showthread.php?t=138293。

no-psy

预设值：无

停用所有会降低PSNR或SSIM的视觉最佳化。这也会停用一些无法透过x264的命令列引数设定的内部psy最佳化。

建议：预设值

no-mixed-refs

预设值：无

混合参照会以每个8x8分割为基础来选取参照，而不是以每个巨集区块为基础。当使用多个参照帧时这会改善品质，虽然要损失一些速度。设定此选项会停用该功能。

建议：预设值

参阅：--ref

no-chroma-me

预设值：无

通常，亮度（luma）和色度（chroma）两个平面都会做动态估算。此选项停用色度动态估算来提高些微速度。

建议：预设值

no-8x8dct

预设值：无

弹性8x8离散余弦转换（Adaptive 8x8 DCT）使x264能够智慧弹性地使用I帧的8x8转换。此选项停用该功能。

建议：预设值

trellis

预设值：1

执行Trellis quantization来提高效率。

0：停用。

1：只在一个巨集区块的最终编码上启用。

2：在所有模式决策上启用。

在巨集区块时提供了速度和效率之间的良好平衡。在所有决策时则更加降低速度。

建议：预设值

注意：需要--cabac

no-fast-pskip

预设值：无

停用P帧的早期略过侦测（early skip detection）。非常轻微地提高品质，但要损失很多速度。

建议：预设值

no-dct-decimate

预设值：无

DCT Decimation会舍弃它认为“不必要的”DCT区块。这会改善编码效率，而降低的品质通常微不足道。设定此选项会停用该功能。

建议：预设值

预设值：0

执行快速的杂讯削减（noise reduction）。根据此值估算影片的杂讯，并借由在量化之前舍弃小细节来尝试移除杂讯。这可能比不上优良的外部杂讯削减筛选的品质，但它执行得非常快。

建议：预设值，或者100~1000

deadzone-inter/intra

预设值：21/11

设定inter/intra亮度量化反应区（deadzone）的大小。反应区的范围应该在0~32。此值设定x264会任意舍弃而不尝试保留细微细节的层级。非常细微的细节既难以看见又耗费位元数，舍弃这些细节可以不用浪费位元数在视讯的此类低收益画面上。反应区与--trellis不相容。

建议：预设值

cqm

预设值：flat

设定所有自订量化矩阵（custom quantization matrices）为内建的预设之一。内建预设有flat和JVT。

建议：预设值

参阅：--cqmfile

cqmfile

预设值：无

从一个指定的JM相容档案来设定自订量化矩阵。覆写所有其他--cqm开头的选项。

建议：预设值

参阅：--cqm

cqm4* / cqm8*

预设值：无

--cqm4：设定所有4x4量化矩阵。需要16个以逗号分隔的整数清单。

--cqm8：设定所有8x8量化矩阵。需要64个以逗号分隔的整数清单。

--cqm4i、--cqm4p、--cqm8i、--cqm8p：设定亮度和色度量化矩阵。

--cqm4iy、--cqm4ic、--cqm4py、--cqm4pc：设定个别量化矩阵。

建议：预设值

视讯可用性资讯

这些选项在输出资料流里设定一个旗标，旗标可以被解码器读取并采取可能的动作。值得一提的是大多数选项在大多数情况下毫无意义，而且通常被解码器忽略。

overscan

预设值：undef

如何处理溢出扫描（overscan）。溢出扫描的意思是装置只显示影像的一部分。

可用的值：

undef：未定义。

show：指示要显示整个影像。理论上如果有设定则必须被遵守。

crop：指示此影像适合在有溢出扫描功能的装置上播放。不一定被遵守。

建议：在编码之前裁剪（Crop），然后如果装置支援则使用show，否则不理会

videoformat

预设值：undef

指示此视讯在编码／数位化（digitizing）之前是什么格式。

可用的值：component, pal, ntsc, secam, mac, undef

建议：来源视讯的格式，或者未定义

fullrange

预设值：off

指示是否使用亮度和色度层级的全范围。如果设为off，则会使用有限范围。

详细资讯可以参阅http://en.wikipedia.org/wiki/YCbCr。

建议：如果来源是从类比视讯数位化，将此设为off。否则设为on

colorprim

预设值：undef

设定以什么色彩原色转换成RGB。

可用的值：undef, bt709, bt470m, bt470bg, smpte170m, smpte240m, film

详细资讯可以参阅http://en.wikipedia.org/wiki/RGB_color_space和http://en.wikipedia.org/wiki/YCbCr。

建议：预设值，除非你知道来源使用什么色彩原色

transfer

预设值：undef

设定要使用的光电子（opto-electronic）传输特性（设定用于修正的色差补正(gamma)曲线）。

可用的值：undef, bt709, bt470m, bt470bg, linear, log100, log316, smpte170m, smpte240m

详细资讯可以参阅http://en.wikipedia.org/wiki/Gamma_correction。

建议：预设值，除非你知道来源使用什么传输特性

colormatrix

预设值：undef

设定用于从RGB原色中取得亮度和色度的矩阵系数。

可用的值：undef, bt709, fcc, bt470bg, smpte170m, smpte240m, GBR, YCgCo

详细资讯可以参阅http://en.wikipedia.org/wiki/YCbCr。

建议：来源使用的矩阵，或者预设值

chromaloc

预设值：0

设定色度采样位置（如ITU-T规格的附录E所定义）

可用的值：0~5

参阅x264的vui.txt。

建议：

如果是从正确次采样4:2:0的MPEG1转码，而且没有做任何色彩空间转换，则应该将此选项设为1。

如果是从正确次采样4:2:0的MPEG2转码，而且没有做任何色彩空间转换，则应该将此选项设为0。

如果是从正确次采样4:2:0的MPEG4转码，而且没有做任何色彩空间转换，则应该将此选项设为0。

否则，维持预设值。

nal-hrd

预设值：none

标志HRD资讯。这是蓝光资料流、电视广播和几个其他专业范围所需要的。

可用的值：

none：不指定HRD资讯。

vbr：指定HRD资讯。

cbr：指定HRD资讯并以--bitrate指定的位元率来封装位元资料流。需要--bitrate模式的位元率控制。

建议：预设值，除非需要标志此资讯

参阅：--vbv-bufsize, --vbv-maxrate, --aud

pic-struct

预设值：无

强制在Picture Timing SEI里传送pic_struct。

当使用--pulldown或--tff/--bff时会自动启用。

建议：预设值

crop-rect

预设值：无

指定一个位元资料流层级的裁剪矩形。如果想要解码器在播放时裁剪，但因为某些原因不想要裁剪视讯再让x264编码，则可以使用此选项。指定的值是在播放时应该被裁剪的像素。

输入／输出

output

预设值：无

指定输出档名。指定的副档名决定视讯的输出格式。如果副档名无法辨识，则预设输出格式是原始格式（raw）视讯资料流（通常储存为.264副档名）。

特殊位置NUL（Windows）或/dev/null（Unix）指明输出应该被丢弃。这在使用--pass 1时特别有用，因为唯一在乎的输出是--stats。

muxer

预设值：auto

指定要输出什么格式。

可用的值：auto, raw, mkv, flv, mp4

auto选项会根据提供的输出档名挑选一个多工器（muxer）。

建议：预设值

参阅：--output

demuxer

预设值：auto

设定x264使用什么解多工器（demuxer）和解码器来剖析输入视讯。

可用的值：auto, raw, y4m, avs, lavf, ffms

如果输入档案有raw、y4m或avs的副档名，则x264会使用相关解多工器来读取档案。标准输入使用原始格式解多工器。否则，x64会尝试以ffms来开启档案，然后再尝试以lavf来开启档案，最后开启失败。

"lavf"和"ffms"选项需要x264以分别的程式库（libraries）编译。如果使用到两者之一，x264会从输入档案带入时间码（timecodes），条件是不能输出为原始格式。这有效地使x264感知VFR。其他选项可以指定--fps为固定帧率，或者指定--tcfile-in为变动帧率。

建议：预设值

参阅：--input, --muxer

input-csp

预设值：无

告诉x264原始格式视讯输入是什么色彩空间。支援的色彩空间可以从x264 --fullhelp的说明里得知。

注意，虽然有支援RGB色彩空间，但视讯在编码之前会使用bt601（即"SD"）矩阵来转换成YUV。

参阅：--input-res, --fps

input-res

预设值：无

指定原始格式视讯输入的解析度。语法是--input-res 720x576。

参阅：--input-csp, --fps

作者：古则

链接：https://www.jianshu.com/p/b46a33dd958d

来源：

著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

2021-06-30

你可能感兴趣的:(2021-06-30)