2021-06-30

FFmpeg X264编码参数

目录

码率控制    1

X264的preset和tune    2

编码延时建议  2

ffmpeg编码参数和x264参数对照 3

x264参数说明    5

2.码率控制

X264提供三种码率控制的方式:bitrate, qp, crf。这三种方式是互斥的,使用时设置其中之一即可。

(1)bitrate

x264会尝试把给定的位元率作为整体平均值来编码。这意味着最终编码文件的大小是已知的,但最终的品质未知。此选项通常与-pass(两阶段编码)一起使用。

注意,ffmpeg中设置bitrate的具体参数为bit_rate,单位是bits/s(x264里面对应参数i_bitrate的单位则是kbits/s, 1kbits为1000bits而非1024bits).

(2)qp

使用qp选项时,表示P帧的量化值为qp。I帧和B帧的量化值则是从--ipratio和--pbratio中取得。可使用默认参数,也可自己设定。使用qp模式,即固定量化值,意味着停用弹性量化(aq_mode)。

当qp为0时,为无损编码。

(3)crf

固定位元率系数,Constant Ratefactor,

可用的值从1到51,越小编码质量越好,码率越高。一般使用16到24,可以为浮点。(crf并不是恒定质量的方式,同一片子同一crf值,其他参数不同可能码率和质量差较大,不同的片子之间就更没有可比性了)

此模式把某个“质量”作为编码目标,根据片子质量自动分配码率的vbr(Variable Bit Rate动态比特率)。X264中构想是让crf n提供与qp n相当的视觉品质,但编码文件更小一些。

CRF是借由降低“较不重要”帧的品质来达到此目的。在此情况下,“较不重要”是指在复杂或高动态场景的帧,其品质不是很耗费位元数就是不易察觉,所以会提高它们的量化值。从这些帧里所节省下来的位元数被重新分配到可以更有效利用的帧。

当crf为0时,与qp 0相同,实现无损编码。

3.X264的preset和tune

鉴于x264的参数众多,各种参数的配合复杂,为了使用者方便,x264建议如无特别需要可使用preset和tune设置。这套开发者推荐的参数较为合理,可在此基础上在调整一些具体参数以符合自己需要,手动设定的参数会覆盖preset和tune里的参数。

--preset的参数主要调节编码速度和质量的平衡,有ultrafast、superfast、veryfast、faster、fast、medium、slow、slower、veryslow、placebo这10个选项,从快到慢。

--tune的参数主要配合视频类型和视觉优化的参数,或特别的情况。如果视频的内容符合其中一个可用的调整值又或者有其中需要,则可以使用此选项,否则建议不使用(如tune grain是为高比特率的编码而设计的)。tune的值有:

film:      电影、真人类型;

animation:  动画;

grain:      需要保留大量的grain时用;

stillimage:  静态图像编码时使用;

psnr:      为提高psnr做了优化的参数;

ssim:      为提高ssim做了优化的参数;

fastdecode: 可以快速解码的参数;

zerolatency:零延迟,用在需要非常低的延迟的情况下,比如电视电话会议的编码。

4.一些编码建议

编码延时

降低x264的延时是可能的,但是会降低质量。若需零延时,设置--tune zerolatency。若你可以接受一点儿小延时(如小于1秒),最好还是允许延时。下列步骤可以降低延迟,当延迟足够小时,就别再进行后续步骤了:

1.从初始值开始

2.关闭sync-lookahead(设置用于线程预测的帧缓存大小。最大值是250.在第二遍及更多遍编码或基于分片线程时自动关闭)

3.降低rc-lookahead,但别小于10(设定mb-tree位元率控制和vbv-lookahead使用的帧数)

4.降低threads(比如从12降到6)

5.使用切片线程(sliced threads)

6.禁用rc-lookahead

7.禁用b-frames

8.实在不行,就用--tune zerolatency

param->rc.i_lookahead = 0;param->i_sync_lookahead = 0; param->i_bframe = 0; param->b_sliced_threads = 1; param->b_vfr_input = 0;param->rc.b_mb_tree = 0;(使用宏块树位元率控制会改善整体压缩率)

x264线程

x264起多少个线程比较好 ?

建议线程数:

1、2、4、8

测试结论:

1、更多的线程会消耗更多总CPU时间片,因此在长期满载的机器上不宜使用多线程。

2、获得的时间收益随线程增多呈递减趋势,8线程以后尤为明显。

3、PNSR下降随线程数增加呈抛物递增趋势,16线程增加到24线程PSNR时下降了0.6之巨。

4、设置threads=auto时,线程数为逻辑CPU个数的1.5倍。

x264各类型帧的大小及编码耗时

注:作参考,未必属实。

I帧、B帧、P帧都极大地受编码参数的影响。

通常情况下:

h264编码的帧由大到小依次为:

I > P > B

(互相之间约有5倍的差距)

x264的编码耗时由长到短依次为:

P > B > I

通常而言,较小的帧因为帧内压缩计算量(deblock、cabac等)小,所以耗时相对短。

P帧的编码耗时长是因为帧间压缩(宏块寻找、运动补偿等)耗时长所以提高了总体耗时。

另外:可以修改x264中的x264_slices_write函数来测量不同类型帧的编码耗时。

5.ffmpeg编码参数和x264参数对照

下面表中涉及的参数直接在AVCodecContext结构中设置:

FFmpeg option  x264 option

Code    Console Console Code

gop_size    -g –keyint    i_keyint_max

bit_rate    -b     –bitrate    rc.i_bitrate

rc_buffer_size  -bufsize –vbv-bufsize    rc.i_vbv_buffer_size

rc_max_rate -maxrate –vbv-maxrate    rc.i_vbv_max_bitrate

max_b_frames    -bf   –bframes    i_bframe

keyint_min  -keyint_min   –min-keyint i_keyint_min

scenechange_threshold  -sc_threshold –scenecut  i_scenecut_threshold

qmin    -qmin –qpmin  rc.i_qp_min

qmax    -qmax –qpmax  rc.i_qp_max

max_qdiff  -qdiff     –qpstep rc.i_qp_step

qcompress  -qcomp   –qcomp  rc.f_qcompress

qblur  -qblur   –qblur  rc.f_qblur

Refs    -refs –ref    i_frame_reference

me_method  -me_method   –me analyse.i_me_method

merange    -me_range –merange    analyse.i_me_range

me_subpel_quality  -subq –subme  analyse.i_subpel_refine

trellis    -trellis <0,1,2>    –trellis    analyse.i_trellis

noise_reduction    -nr   –nr analyse.i_noise_reduction

level  -level     –level  i_level_idc

bit_rate_tolerance

-bt   –ratetol = -bt / -b rc.f_rate_tolerance

rc_initial_buffer_occupancy -rc_init_occupancy   –vbv-init = -rc_init_occupancy / -bufsize  rc.f_vbv_buffer_init

b_quant_factor  -b_qfactor   –pbratio    rc.f_pb_factor

chromaoffset    -chromaoffset –chroma-qp-offset  analyse.i_chroma_qp_offset

thread_count    -threads   –threads    i_threads

me_cmp  -cmp <-chroma/+chroma>  chroma-me  analyse.b_chroma_me

thread_type thread_type sliced_threads  b_sliced_threads

AVCodecContext结构中priv_data可设置的参数见下表:

priv_data(即X264Context option)

preset

tune

profile

fastfirstpass

level

stats

wpredp

x264opts

crf

crf_max

cqp

aq_mode

aq_strength

psy

psy_rd

rc_lookahead

weightb

weightp

ssim

intra_refresh

b_bias

b_pyramid

mixed_refs

dct8x8

fast_pskip

aud

mbtree

deblock

cplxblur

partitions

direct_pred

slice_max_size

stats

nal_hrd

x264_params

其余x264参数设置,见下面格式,多个参数用冒号(:)隔开:

av_opt_set(AVCodecContext->priv_data, "x264opts", "sync-lookahead=0: sliced-threads", 0);

6.x264参数说明

注:下面说明不是最新版本,最新版本请参考x264 --fullhelp

预设

为了减少使用者花费时间和精力在命令列上而设计的一套系统。这些设定切换了什么选项可以从x264 --fullhelp的说明里得知。

profile

预设值:无

限制输出资料流的profile。如果指定了profile,它会覆写所有其他的设定。所以如果指定了profile,将会保证得到一个相容的资料流。如果设了此选项,将会无法使用无失真(lossless)编码(--qp 0或--crf 0)。

如果播放装置仅支援某个profile,则应该设此选项。大多数解码器都支援High profile,所以没有设定的必要。

可用的值:baseline, main, high

preset

预设值:medium

变更选项,以权衡压缩效率和编码速度。如果指定了预设,变更的选项将会在套用所有其他的参数之前套用。

通常应该将此设为所能忍受的最慢一个选项。

可用的值:ultrafast, superfast, veryfast, faster, fast, medium, slow, slower, veryslow, placebo

ultrafast

--no-8x8dct        --aq-mode 0        --b-adapt 0

--bframes 0    --no-cabac      --no-deblock

--no-mbtree      --me dia          --no-mixed-refs

--partitions none  --rc-lookahead 0    --ref 1

--scenecut 0        --subme 0          --trellis 0

--no-weightb        --weightp 0

Superfast

--no-mbtree                --me dia          --no-mixed-refs

--partitions i8x8,i4x4  --rc-lookahead 0    --ref 1

--subme 1              --trellis 0        --weightp 1

param->analyse.inter = X264_ANALYSE_I8x8|X264_ANALYSE_I4x4;

param->analyse.i_me_method = X264_ME_DIA;

param->analyse.i_subpel_refine = 1;

param->i_frame_reference = 1;

param->analyse.b_mixed_references = 0;

param->analyse.i_trellis = 0;

param->rc.b_mb_tree = 0;

param->analyse.i_weighted_pred = X264_WEIGHTP_SIMPLE;

param->rc.i_lookahead = 0;

tune

预设值:无

调整选项,以进一步最佳化为视讯的内容。如果指定了tune,变更的选项将会在--preset之后,但所有其他的参数之前套用。

如果视讯的内容符合其中一个可用的调整值,则可以使用此选项,否则不要使用。

可用的值:film, animation, grain, stillimage, psnr, ssim, fastdecode, zerolatency

slow-firstpass

预设值:无

使用--pass 1会在解析命令列的最后套用以下设定:

--ref 1

--no-8x8dct

--partitions i4x4 (如果最初有启用,否则为无)

--me dia

--subme MIN(2, subme)

--trellis 0

可以使用--slow-firstpass来停用此功能。注意,使用--preset placebo也会启用slow-firstpass。

参阅:--pass

帧类型选项

keyint

预设值:250

设定x264输出的资料流之最大IDR帧(亦称为关键帧)间隔。可以指定infinite让x264永远不要插入非场景变更的IDR帧。

IDR帧是资料流的“分隔符号”,所有帧都无法从IDR帧的另一边参照资料。因此,IDR帧也是I帧,所以它们不从任何其他帧参照资料。这意味着它们可以用作视讯的搜寻点(seek points)。

注意,I帧通常明显大于P/B帧(在低动态场景通常为10倍大或更多),所以当它们与极低的VBV设定合并使用时会打乱位元率控制。在这些情况下,研究--intra-refresh。

预设值对于大多数视讯没啥问题。在为蓝光、广播、即时资料流或某些其他特殊情况编码时,可能需要更小的GOP长度(通常等于帧率)。

参阅:--min-keyint, --scenecut, --intra-refresh

min-keyint

预设值:自动 (MIN(--keyint / 10, --fps))

设定IDR帧之间的最小长度。

IDR帧的说明可以参阅--keyint。过小的keyint范围会导致“不正确的”IDR帧位置(例如闪屏场景)。此选项限制在每个IDR帧之后,要有多少帧才可以再有另一个IDR帧的最小长度。

min-keyint的最大允许值是--keyint/2+1。

建议:预设值,或者等于帧率

参阅:--keyint, --scenecut

no-scenecut

预设值:无

完全停用弹性I帧决策(adaptive I-frame decision)。

参阅:--scenecut

scenecut

预设值:40

设定I/IDR帧位置的阈值(场景变更侦测)。

x264为每一帧计算一个度量值,来估计与前一帧的不同程度。如果该值低于scenecut,则算侦测到一个“场景变更”。如果此时与最近一个IDR帧的距离低于--min-keyint,则放置一个I帧,否则放置一个IDR帧。越大的scenecut值会增加侦测到场景变更的数目。场景变更是如何比较的详细资讯可以参阅http://forum.doom9.org/showthread.php?t=121116。

将scenecut设为0相当于设定--no-scenecut。

建议:预设值

参阅:--keyint, --min-keyint, --no-scenecut

intra-refresh

预设值:无

停用IDR帧,作为替代x264会为每隔--keyint的帧的每个巨集区块(macroblock)使用内部编码(intra coding)。区块是以一个水平卷动的行刷新,称为刷新波(refresh wave)。这有利于低延迟的资料流,使它有可能比标准的IDR帧达到更加固定的帧大小。它也增强了视讯资料流对封包遗失的恢复能力。此选项会降低压缩效率,因此必要时才使用。

有趣的事:

第一帧仍然是IDR帧。

内部区块(Intra-blocks)仅处于P帧里,刷新波在一或多个B帧后的第一个P帧更广泛。

压缩效率的损失主要来自于在刷新波上左侧(新)的巨集区块无法参照右侧(旧)的资料。

bframes

预设值:3

设定x264可以使用的最大并行B帧数。

没有B帧时,一个典型的x264资料流有着像这样的帧类型:IPPPPP...PI。当设了--bframes 2时,最多两个连续的P帧可以被B帧取代,就像:IBPBBPBPPPB...PI。

B帧类似于P帧,除了B帧还能从它之后的帧做动态预测(motion prediction)。就压缩比来说效率会大幅提高。它们的平均品质是由--pbratio所控制。

有趣的事:

x264还区分两种不同种类的B帧。"B"是代表一个被其他帧作为参照帧的B帧(参阅--b-pyramid),而"b"则代表一个不被其他帧作为参照帧的B帧。如果看到一段混合的"B"和"b",原因通常与上述有关。当差别并不重要时,通常就以"B"代表所有B帧。

x264是如何为每个候选帧选定为P帧或B帧的详细资讯可以参阅http://article.gmane.org/gmane.comp.video.ffmpeg.devel/29064。在此情况下,帧类型看起来会像这样(假设--bframes 3):IBBBPBBBPBPI。

参阅:--b-bias, --b-pyramid, --ref, --pbratio, --partitions, --weightb

b-adapt

预设值:1

设定弹性B帧位置决策演算法。此设定控制x264如何决定要放置P帧或B帧。

0:停用,总是挑选B帧。这与旧的no-b-adapt设定相同作用。

1:“快速”演算法,较快,越大的--bframes值会稍微提高速度。当使用此模式时,基本上建议搭配--bframes 16使用。

2:“最佳”演算法,较慢,越大的--bframes值会大幅降低速度。

注意:对于多重阶段(multi-pass)编码,仅在第一阶段(first pass)才需要此选项,因为帧类型在此时已经决定完了。

b-bias

预设值:0

控制使用B帧而不使用P帧的可能性。大于0的值增加偏向B帧的加权,而小于0的值则相反。范围是从-100到100。100并不保证全是B帧(要全是B帧该使用--b-adapt 0),而-100也不保证全是P帧。

仅在你认为能比x264做出更好的位元率控制决策时才使用此选项。

参阅:--bframes, --ipratio

b-pyramid

预设值:normal

允许B帧作为其他帧的参照帧。没有此设定时,帧只能参照I/P帧。虽然I/P帧因其较高的品质作为参照帧更有价值,但B帧也是很有用的。作为参照帧的B帧会得到一个介于P帧和普通B帧之间的量化值。b-pyramid需要至少两个以上的--bframes才会运作。

如果是在为蓝光编码,须使用none或strict。

none:不允许B帧作为参照帧。

strict:每minigop允许一个B帧作为参照帧,这是蓝光标准强制执行的限制。

normal:每minigop允许多个B帧作为参照帧。

参阅:--bframes, --refs, --no-mixed-refs

open-gop

预设值:none

open-gop是一个提高效率的编码技术。有三种模式:

none:停用open-gop。

normal:启用open-gop。

bluray:启用open-gop。一个效率较低的open-gop版本,因为normal模式无法用于蓝光编码。

某些解码器不完全支援open-gop资料流,这就是为什么此选项并未预设为启用。如果想启用open-gop,应该先测试所有可能用来拨放的解码器。

open-gop的说明可以参阅http://forum.doom9.org/showthread.php?p=1300124#post1300124。

no-cabac

预设值:无

停用弹性内容的二进位算数编码(CABAC:Context Adaptive Binary Arithmetic Coder)资料流压缩,切换回效率较低的弹性内容的可变长度编码(CAVLC:Context Adaptive Variable Length Coder)系统。大幅降低压缩效率(通常10~20%)和解码的硬体需求。

ref

预设值:3

控制解码图片缓冲(DPB:Decoded Picture Buffer)的大小。范围是从0到16。总之,此值是每个P帧可以使用先前多少帧作为参照帧的数目(B帧可以使用的数目要少一或两个,取决于它们是否作为参照帧)。可以被参照的最小ref数是1。

还要注意的是,H.264规格限制了每个level的DPB大小。如果遵守Level 4.1规格,720p和1080p视讯的最大ref数分别是9和4。

参阅:--b-pyramid, --no-mixed-refs, --level

no-deblock

预设值:无

完全停用循环筛选(loop filter)。不建议。

参阅:--deblock

deblock

预设值:0:0

控制循环筛选(亦称为持续循环去区块(inloop deblocker)),这是H.264标准的一部分。就性价比来说非常有效率。

可以在http://forum.doom9.org/showthread.php?t=109747找到loop滤镜的参数是如何运作的说明(参阅第一个帖子和akupenguin的回复)。

参阅:--no-deblock

slices

预设值:无

设定每帧的切片数,而且强制为矩形切片(会被--slice-max-size或--slice-max-mbs覆写)。

如果是在为蓝光编码,将值设为4。否则,不要使用此选项,除非你知道真的有必要。

参阅:--slice-max-size, --slice-max-mbs

slice-max-size

预设值:无

设定最大的切片大小(单位是位元组),包括估计的NAL额外负荷(overhead)。(目前与--interlaced不相容)

参阅:--slices

slice-max-mbs

预设值:无

设定最大的切片大小(单位是巨集区块)。(目前与--interlaced不相容)

参阅:--slices

tff

预设值:无

启用交错式编码并指定顶场优先(top field first)。x264的交错式编码使用MBAFF,本身效率比渐进式编码差。出于此原因,仅在打算于交错式显示器上播放视讯时,才应该编码为交错式(或者视讯在送给x264之前无法进行去交错)。此选项会自动启用--pic-struct。

bff

预设值:无

启用交错式编码并指定底场优先(bottom field first)。详细资讯可以参阅--tff。

constrained-intra

预设值:无

启用限制的内部预测(constrained intra prediction),这是SVC编码的基础层(base layer)所需要的。既然EveryoneTM忽略SVC,你同样可以忽略此选项。

pulldown

预设值:none

使用其中一个预设模式将渐进式、固定帧率的输入资料流标志上软胶卷过带(soft telecine)。软胶卷过带在http://trac.handbrake.fr/wiki/Telecine有更详细的解释。

可用的预设:none, 22, 32, 64, double, triple, euro

指定除了none以外的任一模式会自动启用--pic-struct。

fake-interlaced

预设值:无

将资料流标记为交错式,即使它并未以交错式来编码。用于编码25p和30p为符合蓝光标准的视讯。

frame-packing

预设值:无

如果在编码3D视讯,此参数设定一个位元资料流(bitstream)旗标,用来告诉解码器3D视讯是如何被封装。相关的值和它们的意义可以从x264 --fullhelp的说明里得知。

位元率控制

qp

预设值:无

三种位元率控制方法之一。设定x264以固定量化值(Constant Quantizer)模式来编码视讯。这里给的值是指定P帧的量化值。I帧和B帧的量化值则是从--ipratio和--pbratio中取得。CQ模式把某个量化值作为目标,这意味着最终档案大小是未知的(虽然可以透过一些方法来准确地估计)。将值设为0会产生无失真输出。对于相同视觉品质,qp会比--crf产生更大的档案。qp模式也会停用弹性量化,因为按照定义“固定量化值”意味着没有弹性量化。

此选项与--bitrate和--crf互斥。各种位元率控制系统的详细资讯可以参阅http://git.videolan.org/?p=x264.git;a=blob_plain;f=doc/ratecontrol.txt;hb=HEAD。

虽然qp不需要lookahead来执行因此速度较快,但通常应该改用--crf。

参阅:--bitrate, --crf, --ipratio, --pbratio

bitrate

预设值:无

三种位元率控制方法之二。以目标位元率模式来编码视讯。目标位元率模式意味着最终档案大小是已知的,但最终品质则未知。x264会尝试把给定的位元率作为整体平均值来编码视讯。参数的单位是千位元/秒(8位元=1位元组)。注意,1千位元(kilobit)是1000位元,而不是1024位元。

此设定通常与--pass在两阶段(two-pass)编码一起使用。

此选项与--qp和--crf互斥。各种位元率控制系统的详细资讯可以参阅http://git.videolan.org/?p=x264.git;a=blob_plain;f=doc/ratecontrol.txt;hb=HEAD。

参阅:--qp, --crf, --ratetol, --pass, --stats

crf

预设值:23.0

最后一种位元率控制方法:固定位元率系数(Constant Ratefactor)。当qp是把某个量化值作为目标,而bitrate是把某个档案大小作为目标时,crf则是把某个“品质”作为目标。构想是让crf n提供的视觉品质与qp n相同,只是档案更小一点。crf值的度量单位是“位元率系数(ratefactor)”。

CRF是借由降低“较不重要”的帧之品质来达到此目的。在此情况下,“较不重要”是指在复杂或高动态场景的帧,其品质不是很耗费位元数就是不易察觉,所以会提高它们的量化值。从这些帧里所节省下来的位元数被重新分配到可以更有效利用的帧。

CRF花费的时间会比两阶段编码少,因为两阶段编码中的“第一阶段”被略过了。另一方面,要预测CRF编码的最终位元率是不可能的。根据情况哪种位元率控制模式更好是由你来决定。

此选项与--qp和--bitrate互斥。各种位元率控制系统的详细资讯可以参阅http://git.videolan.org/?p=x264.git;a=blob_plain;f=doc/ratecontrol.txt;hb=HEAD。

参阅:--qp, --bitrate

rc-lookahead

预设值:40

设定mb-tree位元率控制和vbv-lookahead使用的帧数。最大允许值是250。

对于mb-tree部分,增加帧数带来更好的效果但也会更慢。mb-tree使用的最大缓冲值是MIN(rc-lookahead, --keyint)。

对于vbv-lookahead部分,当使用vbv时,增加帧数带来更好的稳定性和准确度。vbv-lookahead使用的最大值是:

MIN(rc-lookahead, MAX(--keyint, MAX(--vbv-maxrate, --bitrate) / --vbv-bufsize * --fps))

参阅:--no-mbtree, --vbv-bufsize, --vbv-maxrate

什么是Macroblock Tree

Macroblock Tree是一个基于macroblock的qp控制方法。MB Tree的工作原理类似于古典的qp compression,只不过qcomp处理的对象是整张frame而MB Tree针对的是每个MB进行处理。工作过程简单来说,是对于每个MB,向前预测一定数量的帧(该数量由rc-lookahead和keyint的较小值决定)中该MB被参考的情况,根据引用次数的多寡,决定对该MB使用何种大小的qp进行quantization。而qp的大小与被参考次数成反比,也就是说,对于被参考次数多的MB,264的解码器认为此对应于缓慢变化的场景,因此给与比较高的质量(比较低的qp数值)。至于视频的变化率与人眼感知能力的关系,这是一个基于主观测试的经验结果:视频变化率越大 人眼的敏感度越低,也就是说,人眼可以容忍快速变化场景的某些缺陷,但相对而言某些平滑场景的缺陷,人眼则相当敏感。注意此处说的平滑,指的是沿时间维度上场景的变化频率,而非普通意义上的像素域中的场景。

vbv-maxrate

预设值:0

设定重新填满VBV缓冲的最大位元率。

VBV会降低品质,所以必要时才使用。

参阅:--vbv-bufsize, --vbv-init, VBV编码建议

vbv-bufsize

预设值:0

设定VBV缓冲的大小(单位是千位元)。

VBV会降低品质,所以必要时才使用。

参阅:--vbv-maxsize, --vbv-init, VBV编码建议

vbv-init

预设值:0.9

设定VBV缓冲必须填满多少才会开始播放。

如果值小于1,初始的填满量是:vbv-init * vbv-bufsize。否则该值即是初始的填满量(单位是千位元)。

参阅:--vbv-maxsize, --vbv-bufsize, VBV编码建议

crf-max

预设值:无

一个类似--qpmax的设定,除了指定的是最大位元率系数而非最大量化值。当使用--crf且启用VBV时,此选项才会运作。它阻止x264降低位元率系数(亦称为“品质”)到低于给定的值,即使这样做会违反VBV的条件约束。此设定主要适用于自订资料流伺服器。详细资讯可以参阅http://git.videolan.org/gitweb.cgi/x264.git/?a=commit;h=81eee062a4ce9aae1eceb3befcae855c25e5ec52。

参阅:--crf, --vbv-maxrate, --vbv-bufsize

qpmin

预设值:0

定义x264可以使用的最小量化值。量化值越小,输出就越接近输入。到了一定的值,x264的输出看起来会跟输入一样,即使它并不完全相同。通常没有理由允许x264花费比这更多的位元数在任何特定的巨集区块上。

当弹性量化启用时(预设启用),不建议提高qpmin,因为这会降低帧里面平面背景区域的品质。

参阅:--qpmax, --ipratio

关于qpmin的预设值:在x264 r1795版本之前,该选项预设值为10。

qpmax

预设值:51

定义x264可以使用的最大量化值。预设值51是H.264规格可供使用的最大量化值,而且品质极低。此预设值有效地停用了qpmax。如果想要限制x264可以输出的最低品质,可以将此值设小一点(通常30~40),但通常并不建议调整此值。

参阅:--qpmin, --pbratio, --crf-max

qpstep

预设值:4

设定两帧之间量化值的最大变更幅度。

ratetol

预设值:1.0

此参数有两个目的:

在一阶段位元率编码时,此设定控制x264可以偏离目标平均位元率的百分比。可以指定inf来完全停用溢出侦测(overflow detection)。可以设定的最小值是0.01。值设得越大,x264可以对接近电影结尾的复杂场景作出越好的反应。此目的的度量单位是百分比(例如,1.0等于允许1%的位元率偏差)。

很多电影(例如动作片)在电影结尾时是最复杂的。因为一阶段编码并不知道这一点,结尾所需的位元数通常被低估。将ratetol设为inf可以减轻此情况,借由允许编码以更像--crf的模式运行,但档案大小会暴增。

当VBV启用时(即指定了--vbv-开头的选项),此设定也会影响VBV的强度。值设得越大,允许VBV在冒着可能违反VBV设定的风险下有越大的波动。

ipratio

预设值:1.40

修改I帧量化值相比P帧量化值的目标平均增量。越大的值会提高I帧的品质。

参阅:--pbratio

pbratio

预设值:1.30

修改B帧量化值相比P帧量化值的目标平均减量。越大的值会降低B帧的品质。当mbtree启用时(预设启用),此设定无作用,mbtree会自动计算最佳值。

参阅:--ipratio

chroma-qp-offset

预设值:0

在编码时增加色度平面量化值的偏移。偏移可以为负数。

当使用psy-rd或psy-trellis时,x264自动降低此值来提高亮度的品质,其后降低色度的品质。这些设定的预设值会使chroma-qp-offset再减去2。

注意:x264仅在同一量化值编码亮度平面和色度平面,直到量化值29。在此之后,色度逐步以比亮度低的量被量化,直到亮度在q51和色度在q39为止。此行为是由H.264标准所要求。

aq-mode

预设值:1

弹性量化模式。没有AQ时,x264很容易分配不足的位元数到细节较少的部分。AQ是用来更好地分配视讯里所有巨集区块之间的可用位元数。此设定变更AQ会重新分配位元数到什么范围里:

0:完全不使用AQ。

1:允许AQ重新分配位元数到整个视讯和帧内。

2:自动变化(Auto-variance)AQ,会尝试对每帧调整强度。(实验性的)

参阅:--aq-strength

aq-strength

预设值:1.0

弹性量化强度。设定AQ偏向低细节(平面)的巨集区块之强度。不允许为负数。0.0~2.0以外的值不建议。

参阅:--aq-mode

pass

预设值:无

此为两阶段编码的一个重要设定。它控制x264如何处理--stats档案。有三种设定:

1:建立一个新的统计资料档案。在第一阶段使用此选项。

2:读取统计资料档案。在最终阶段使用此选项。

3:读取统计资料档案并更新。

统计资料档案包含每个输入帧的资讯,可以输入到x264以改善输出。构想是执行第一阶段来产生统计资料档案,然后第二阶段将建立一个最佳化的视讯编码。改善的地方主要是从更好的位元率控制中获益。

参阅:--stats, --bitrate, --slow-firstpass, X264统计资料档案

stats

预设值:"x264_2pass.log"

设定x264读取和写入统计资料档案的位置。

参阅:--pass, X264统计资料档案

no-mbtree

预设值:无

停用巨集区块树(macroblock tree)位元率控制。使用巨集区块树位元率控制会改善整体压缩率,借由追踪跨帧的时间传播(temporal propagation)并相应地加权。除了已经存在的统计资料档案之外,多重阶段编码还需要一个新的统计资料档案。

建议:预设值

参阅:--rc-lookahead

qcomp

预设值:0.60

量化值曲线压缩系数。0.0是固定位元率,1.0则是固定量化值。

当mbtree启用时,它会影响mbtree的强度(qcomp越大,mbtree越弱)。

建议:预设值

参阅:--cplxblur, --qblur

cplxblur

预设值:20.0

以给定的半径范围套用高斯模糊(gaussian blur)于量化值曲线。这意味着分配给每个帧的量化值会被它的邻近帧模糊掉,以此来限制量化值波动。

参阅:--qcomp, --qblur

qblur

预设值:0.5

在曲线压缩之后,以给定的半径范围套用高斯模糊于量化值曲线。不怎么重要的设定。

参阅:--qcomp, --cplxblur

zones

预设值:无

调整视讯的特定片段之设定。可以修改每区段的大多数x264选项。

一个单一区段的形式为<起始帧>,<结束帧>,<选项>。

多个区段彼此以"/"分隔。

选项:

这两个是特殊选项。每区段只能设定其中一个,而且如果有设定其中一个,它必须为该区段列出的第一个选项:

b=<浮点数> 套用位元率乘数在此区段。在额外调整高动态和低动态场景时很有用。

q=<整数> 套用固定量化值在此区段。在套用于一段范围的帧时很有用。

其他可用的选项如下:

ref=<整数>

b-bias=<整数>

scenecut=<整数>

no-deblock

deblock=<整数>:<整数>

deadzone-intra=<整数>

deadzone-inter=<整数>

direct=<字串>

merange=<整数>

nr=<整数>

subme=<整数>

trellis=<整数>

(no-)chroma-me

(no-)dct-decimate

(no-)fast-pskip

(no-)mixed-refs

psy-rd=<浮点数>:<浮点数>

me=<字串>

no-8x8dct

b-pyramid=<字串>

限制:

一个区段的参照帧数无法超过--ref所指定的大小。

无法开启或关闭scenecut;如果--scenecut最初为开启(>0),则只能改变scenecut的大小。

如果使用--me esa/tesa,merange无法超过最初所指定的大小。

如果--subme最初指定为0,则无法变更subme。

如果--me最初指定为dia、hex或umh,则无法将me设为esa为tesa。

范例:0,1000,b=2/1001,2000,q=20,me=3,b-bias=-1000

建议:预设值

qpfile

预设值:无

手动覆写标准的位元率控制。指定一个档案,为指定的帧赋予量化值和帧类型。格式为“帧号 帧类型 量化值”。例如:

0 I 18 < IDR (key) I-frame

1 P 18 < P-frame

2 B 18 < Referenced B-frame

3 i 18 < Non-IDR (non-key) I-frame

4 b 18 < Non-referenced B-frame

5 K 18 < Keyframe*

不需要指定每个帧。

使用-1作为所需的量化值允许x264自行选择最佳的量化值,在只需设定帧类型时很有用。

在指定了大量的帧类型和量化值时仍然让x264间歇地自行选择,会降低x264的效能。

"Keyframe"是一个泛用关键帧/搜寻点,如果--open-gop是none则等同于一个IDR I帧,否则等同于一个加上Recovery Point SEI旗标的Non-IDR I帧。

分析

partitions

预设值:p8x8,b8x8,i8x8,i4x4

H.264视讯在压缩过程中划分为16x16的巨集区块。这些区块可以进一步划分为更小的分割,这就是此选项要控制的部分。

此选项可以启用个别分割。分割依不同帧类型启用。

可用的分割:p8x8, p4x4, b8x8, i8x8, i4x4, none, all

I:i8x8、i4x4。

P:p8x8(也会启用p16x8/p8x16)、p4x4(也会启用p8x4/p4x8)。

B:b8x8(也会启用b16x8/b8x16)。

p4x4通常不怎么有用,而且性价比极低。

参阅:--no-8x8dct

direct

预设值:spatial

设定"direct"动态向量(motion vectors)的预测模式。有两种模式可用:spatial和temporal。可以指定none来停用direct动态向量,和指定auto来允许x264在两者之间切换为适合的模式。如果设为auto,x264会在编码结束时输出使用情况的资讯。auto最适合用于两阶段编码,但也可用于一阶段编码。在第一阶段auto模式,x264持续记录每个方法执行到目前为止的好坏,并从该记录挑选下一个预测模式。注意,仅在第一阶段有指定auto时,才应该在第二阶段指定auto;如果第一阶段不是指定auto,第二阶段将会预设为temporal。none模式会浪费位元数,因此强烈不建议。

建议:auto

no-weightb

预设值:无

H.264允许“加权”B帧的参照,它允许变更每个参照影响预测图片的程度。此选项停用该功能。

建议:预设值

weightp

预设值:2

使x264能够使用明确加权预测(explicit weighted prediction)来改善P帧的压缩。亦改善淡入/淡出的品质。模式越高越慢。

注意:在为Adobe Flash编码时,将值设为1,否则它的解码器会产生不自然痕迹(artifacts)。Flash 10.1修正了此bug。

模式:

0:停用。

1:简易:分析淡入/淡出,但不分析重复参照帧。

2:智慧:分析淡入/淡出和重复参照帧。

me

预设值:hex

设定全像素(full-pixel)动态估算(motion estimation)的方法。有五个选项:

dia(diamond):最简单的搜寻方法,起始于最佳预测器(predictor),检查上、左、下、右方一个像素的动态向量,挑选其中最好的一个,并重复此过程直到它不再找到任何更好的动态向量为止。

hex(hexagon):由类似策略组成,除了它使用周围6点范围为2的搜寻,因此叫做六边形。它比dia更有效率且几乎没有变慢,因此作为一般用途的编码是个不错的选择。

umh(uneven multi-hex):比hex更慢,但搜寻复杂的多六边形图样以避免遗漏难以找到的动态向量。不像hex和dia,merange参数直接控制umh的搜寻半径,允许增加或减少广域搜寻的大小。

esa(exhaustive):一种在merange内整个动态搜寻空间的高度最佳化智慧搜寻。虽然速度较快,但数学上相当于搜寻该区域每个单一动态向量的暴力(bruteforce)方法。不过,它仍然比UMH还要慢,而且没有带来很大的好处,所以对于日常的编码不是特别有用。

tesa(transformed exhaustive):一种尝试接近在每个动态向量执行Hadamard转换法比较的效果之演算法,就像exhaustive,但效果好一点而速度慢一点。

参阅:--merange

merange

预设值:16

merange控制动态搜寻的最大范围(单位是像素)。对于hex和dia,范围限制在4~16。对于umh和esa,它可以增加到超过预设值16来允许范围更广的动态搜寻,对于HD视讯和高动态镜头很有用。注意,对于umh、esa和tesa,增加merange会大幅减慢编码速度。

参阅:--me

mvrange

预设值:-1 (自动)

设定动态向量的最大(垂直)范围(单位是像素)。预设值依level不同:

Level 1/1b:64。

Level 1.1~2.0:128。

Level 2.1~3.0:256。

Level 3.1+:512。

注意:如果想要手动覆写mvrange,在设定时从上述值减去0.25(例如--mvrange 127.75)。

建议:预设值

mvrange-thread

预设值:-1 (自动)

设定执行绪之间的最小动态向量缓冲。不要碰它。

建议:预设值

subme

预设值:7

设定子像素(subpixel)估算复杂度。值越高越好。层级1~5只是控制子像素细分(refinement)强度。层级6为模式决策启用RDO,而层级8为动态向量和内部预测模式启用RDO。RDO层级明显慢于先前的层级。

使用小于2的值不但会启用较快且品质较低的lookahead模式,而且导致较差的--scenecut决策,因此不建议。

可用的值:

0:Fullpel only

1:QPel SAD 1 iteration

2:QPel SATD 2 iterations

3:HPel on MB then QPel

4:Always QPel

5:Multi QPel + bi-directional motion estimation

6:RD on I/P frames

7:RD on all frames

8:RD refinement on I/P frames

9:RD refinement on all frames

10:QP-RD (requires --trellis=2, --aq-mode>0)

建议:预设值,或者更高,除非速度非常重要

psy-rd

预设值:1.0:0.0

第一个数是Psy-RDO的强度(需要subme>=6)。第二个数是Psy-Trellis的强度(需要trellis>=1)。注意,Trellis仍然被视为“实验性的”,而且几乎可以肯定至少卡通不适合使用。

psy-rd的解释可以参阅http://forum.doom9.org/showthread.php?t=138293。

no-psy

预设值:无

停用所有会降低PSNR或SSIM的视觉最佳化。这也会停用一些无法透过x264的命令列引数设定的内部psy最佳化。

建议:预设值

no-mixed-refs

预设值:无

混合参照会以每个8x8分割为基础来选取参照,而不是以每个巨集区块为基础。当使用多个参照帧时这会改善品质,虽然要损失一些速度。设定此选项会停用该功能。

建议:预设值

参阅:--ref

no-chroma-me

预设值:无

通常,亮度(luma)和色度(chroma)两个平面都会做动态估算。此选项停用色度动态估算来提高些微速度。

建议:预设值

no-8x8dct

预设值:无

弹性8x8离散余弦转换(Adaptive 8x8 DCT)使x264能够智慧弹性地使用I帧的8x8转换。此选项停用该功能。

建议:预设值

trellis

预设值:1

执行Trellis quantization来提高效率。

0:停用。

1:只在一个巨集区块的最终编码上启用。

2:在所有模式决策上启用。

在巨集区块时提供了速度和效率之间的良好平衡。在所有决策时则更加降低速度。

建议:预设值

注意:需要--cabac

no-fast-pskip

预设值:无

停用P帧的早期略过侦测(early skip detection)。非常轻微地提高品质,但要损失很多速度。

建议:预设值

no-dct-decimate

预设值:无

DCT Decimation会舍弃它认为“不必要的”DCT区块。这会改善编码效率,而降低的品质通常微不足道。设定此选项会停用该功能。

建议:预设值

nr

预设值:0

执行快速的杂讯削减(noise reduction)。根据此值估算影片的杂讯,并借由在量化之前舍弃小细节来尝试移除杂讯。这可能比不上优良的外部杂讯削减筛选的品质,但它执行得非常快。

建议:预设值,或者100~1000

deadzone-inter/intra

预设值:21/11

设定inter/intra亮度量化反应区(deadzone)的大小。反应区的范围应该在0~32。此值设定x264会任意舍弃而不尝试保留细微细节的层级。非常细微的细节既难以看见又耗费位元数,舍弃这些细节可以不用浪费位元数在视讯的此类低收益画面上。反应区与--trellis不相容。

建议:预设值

cqm

预设值:flat

设定所有自订量化矩阵(custom quantization matrices)为内建的预设之一。内建预设有flat和JVT。

建议:预设值

参阅:--cqmfile

cqmfile

预设值:无

从一个指定的JM相容档案来设定自订量化矩阵。覆写所有其他--cqm开头的选项。

建议:预设值

参阅:--cqm

cqm4* / cqm8*

预设值:无

--cqm4:设定所有4x4量化矩阵。需要16个以逗号分隔的整数清单。

--cqm8:设定所有8x8量化矩阵。需要64个以逗号分隔的整数清单。

--cqm4i、--cqm4p、--cqm8i、--cqm8p:设定亮度和色度量化矩阵。

--cqm4iy、--cqm4ic、--cqm4py、--cqm4pc:设定个别量化矩阵。

建议:预设值

视讯可用性资讯

这些选项在输出资料流里设定一个旗标,旗标可以被解码器读取并采取可能的动作。值得一提的是大多数选项在大多数情况下毫无意义,而且通常被解码器忽略。

overscan

预设值:undef

如何处理溢出扫描(overscan)。溢出扫描的意思是装置只显示影像的一部分。

可用的值:

undef:未定义。

show:指示要显示整个影像。理论上如果有设定则必须被遵守。

crop:指示此影像适合在有溢出扫描功能的装置上播放。不一定被遵守。

建议:在编码之前裁剪(Crop),然后如果装置支援则使用show,否则不理会

videoformat

预设值:undef

指示此视讯在编码/数位化(digitizing)之前是什么格式。

可用的值:component, pal, ntsc, secam, mac, undef

建议:来源视讯的格式,或者未定义

fullrange

预设值:off

指示是否使用亮度和色度层级的全范围。如果设为off,则会使用有限范围。

详细资讯可以参阅http://en.wikipedia.org/wiki/YCbCr。

建议:如果来源是从类比视讯数位化,将此设为off。否则设为on

colorprim

预设值:undef

设定以什么色彩原色转换成RGB。

可用的值:undef, bt709, bt470m, bt470bg, smpte170m, smpte240m, film

详细资讯可以参阅http://en.wikipedia.org/wiki/RGB_color_space和http://en.wikipedia.org/wiki/YCbCr。

建议:预设值,除非你知道来源使用什么色彩原色

transfer

预设值:undef

设定要使用的光电子(opto-electronic)传输特性(设定用于修正的色差补正(gamma)曲线)。

可用的值:undef, bt709, bt470m, bt470bg, linear, log100, log316, smpte170m, smpte240m

详细资讯可以参阅http://en.wikipedia.org/wiki/Gamma_correction。

建议:预设值,除非你知道来源使用什么传输特性

colormatrix

预设值:undef

设定用于从RGB原色中取得亮度和色度的矩阵系数。

可用的值:undef, bt709, fcc, bt470bg, smpte170m, smpte240m, GBR, YCgCo

详细资讯可以参阅http://en.wikipedia.org/wiki/YCbCr。

建议:来源使用的矩阵,或者预设值

chromaloc

预设值:0

设定色度采样位置(如ITU-T规格的附录E所定义)

可用的值:0~5

参阅x264的vui.txt。

建议:

如果是从正确次采样4:2:0的MPEG1转码,而且没有做任何色彩空间转换,则应该将此选项设为1。

如果是从正确次采样4:2:0的MPEG2转码,而且没有做任何色彩空间转换,则应该将此选项设为0。

如果是从正确次采样4:2:0的MPEG4转码,而且没有做任何色彩空间转换,则应该将此选项设为0。

否则,维持预设值。

nal-hrd

预设值:none

标志HRD资讯。这是蓝光资料流、电视广播和几个其他专业范围所需要的。

可用的值:

none:不指定HRD资讯。

vbr:指定HRD资讯。

cbr:指定HRD资讯并以--bitrate指定的位元率来封装位元资料流。需要--bitrate模式的位元率控制。

建议:预设值,除非需要标志此资讯

参阅:--vbv-bufsize, --vbv-maxrate, --aud

pic-struct

预设值:无

强制在Picture Timing SEI里传送pic_struct。

当使用--pulldown或--tff/--bff时会自动启用。

建议:预设值

crop-rect

预设值:无

指定一个位元资料流层级的裁剪矩形。如果想要解码器在播放时裁剪,但因为某些原因不想要裁剪视讯再让x264编码,则可以使用此选项。指定的值是在播放时应该被裁剪的像素。

输入/输出

output

预设值:无

指定输出档名。指定的副档名决定视讯的输出格式。如果副档名无法辨识,则预设输出格式是原始格式(raw)视讯资料流(通常储存为.264副档名)。

特殊位置NUL(Windows)或/dev/null(Unix)指明输出应该被丢弃。这在使用--pass 1时特别有用,因为唯一在乎的输出是--stats。

muxer

预设值:auto

指定要输出什么格式。

可用的值:auto, raw, mkv, flv, mp4

auto选项会根据提供的输出档名挑选一个多工器(muxer)。

建议:预设值

参阅:--output

demuxer

预设值:auto

设定x264使用什么解多工器(demuxer)和解码器来剖析输入视讯。

可用的值:auto, raw, y4m, avs, lavf, ffms

如果输入档案有raw、y4m或avs的副档名,则x264会使用相关解多工器来读取档案。标准输入使用原始格式解多工器。否则,x64会尝试以ffms来开启档案,然后再尝试以lavf来开启档案,最后开启失败。

"lavf"和"ffms"选项需要x264以分别的程式库(libraries)编译。如果使用到两者之一,x264会从输入档案带入时间码(timecodes),条件是不能输出为原始格式。这有效地使x264感知VFR。其他选项可以指定--fps为固定帧率,或者指定--tcfile-in为变动帧率。

建议:预设值

参阅:--input, --muxer

input-csp

预设值:无

告诉x264原始格式视讯输入是什么色彩空间。支援的色彩空间可以从x264 --fullhelp的说明里得知。

注意,虽然有支援RGB色彩空间,但视讯在编码之前会使用bt601(即"SD")矩阵来转换成YUV。

参阅:--input-res, --fps

input-res

预设值:无

指定原始格式视讯输入的解析度。语法是--input-res 720x576。

参阅:--input-csp, --fps

作者:古则

链接:https://www.jianshu.com/p/b46a33dd958d

来源:

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

你可能感兴趣的:(2021-06-30)