FFmpeg 是視頻處理最常用的開源軟件。
它功能強(qiáng)大,用途廣泛,大量用于視頻網(wǎng)站和商業(yè)軟件(比如 Youtube 和 iTunes),也是許多音頻和視頻格式的標(biāo)準(zhǔn)編碼/解碼實(shí)現(xiàn)。
FFmpeg 本身是一個(gè)龐大的項(xiàng)目,包含許多組件和庫(kù)文件,最常用的是它的命令行工具。本文介紹 FFmpeg 命令行如何處理視頻,比桌面視頻處理軟件更簡(jiǎn)潔高效。
如果你還沒安裝,可以根據(jù)官方文檔 先完成安裝。
介紹 FFmpeg 用法之前,需要了解一些視頻處理的基本概念。
視頻文件本身其實(shí)是一個(gè)容器(container),里面包括了視頻和音頻,也可能有字幕等其他內(nèi)容。
常見的容器格式有以下幾種。一般來(lái)說(shuō),視頻文件的后綴名反映了它的容器格式。
MP4
MKV
WebM
AVI
下面的命令查看 FFmpeg 支持的容器。
$ ffmpeg -formats
視頻和音頻都需要經(jīng)過編碼,才能保存成文件。不同的編碼格式(CODEC),有不同的壓縮率,會(huì)導(dǎo)致文件大小和清晰度的差異。
常用的視頻編碼格式如下。
H.262
H.264
H.265
上面的編碼格式都是有版權(quán)的,但是可以免費(fèi)使用。此外,還有幾種無(wú)版權(quán)的視頻編碼格式。
VP8
VP9
AV1
常用的音頻編碼格式如下。
MP3
AAC
上面所有這些都是有損的編碼格式,編碼后會(huì)損失一些細(xì)節(jié),以換取壓縮后較小的文件體積。無(wú)損的編碼格式壓縮出來(lái)的文件體積較大,這里就不介紹了。
下面的命令可以查看 FFmpeg 支持的編碼格式,視頻編碼和音頻編碼都在內(nèi)。
$ ffmpeg -codecs
編碼器(encoders)是實(shí)現(xiàn)某種編碼格式的庫(kù)文件。只有安裝了某種格式的編碼器,才能實(shí)現(xiàn)該格式視頻/音頻的編碼和解碼。
以下是一些 FFmpeg 內(nèi)置的視頻編碼器。
libx264:最流行的開源 H.264 編碼器
NVENC:基于 NVIDIA GPU 的 H.264 編碼器
libx265:開源的 HEVC 編碼器
libvpx:谷歌的 VP8 和 VP9 編碼器
libaom:AV1 編碼器
音頻編碼器如下。
libfdk-aac
aac
下面的命令可以查看 FFmpeg 已安裝的編碼器。
$ ffmpeg -encoders
FFmpeg 的命令行參數(shù)非常多,可以分成五個(gè)部分。
$ ffmpeg {1} {2} -i {3} {4} {5}
上面命令中,五個(gè)部分的參數(shù)依次如下。
全局參數(shù)
輸入文件參數(shù)
輸入文件
輸出文件參數(shù)
輸出文件
參數(shù)太多的時(shí)候,為了便于查看,ffmpeg 命令可以寫成多行。
$ ffmpeg [全局參數(shù)] [輸入文件參數(shù)] -i [輸入文件] [輸出文件參數(shù)] [輸出文件]
下面是一個(gè)例子。
$ ffmpeg -y \ # 全局參數(shù)-c:a libfdk_aac -c:v libx264 \ # 輸入文件參數(shù)-i input.mp4 \ # 輸入文件-c:v libvpx-vp9 -c:a libvorbis \ # 輸出文件參數(shù)output.webm # 輸出文件
上面的命令將 mp4 文件轉(zhuǎn)成 webm 文件,這兩個(gè)都是容器格式。輸入的 mp4 文件的音頻編碼格式是 aac,視頻編碼格式是 H.264;輸出的 webm 文件的視頻編碼格式是 VP9,音頻格式是 Vorbis。
如果不指明編碼格式,F(xiàn)Fmpeg 會(huì)自己判斷輸入文件的編碼。因此,上面的命令可以簡(jiǎn)單寫成下面的樣子。
$ ffmpeg -i input.avi output.mp4
FFmpeg 常用的命令行參數(shù)如下。
-c
:指定編碼器
-c copy
:直接復(fù)制,不經(jīng)過重新編碼(這樣比較快)
-c:v
:指定視頻編碼器
-c:a
:指定音頻編碼器
-i
:指定輸入文件
-an
:去除音頻流
-vn
: 去除視頻流
-preset
:指定輸出的視頻質(zhì)量,會(huì)影響文件的生成速度,有以下幾個(gè)可用的值 ultrafast, superfast, veryfast, faster, fast, medium, slow, slower, veryslow。
-y
:不經(jīng)過確認(rèn),輸出時(shí)直接覆蓋同名文件。
下面介紹 FFmpeg 幾種常見用法。
查看視頻文件的元信息,比如編碼格式和比特率,可以只使用-i
參數(shù)。
$ ffmpeg -i input.mp4
上面命令會(huì)輸出很多冗余信息,加上-hide_banner
參數(shù),可以只顯示元信息。
$ ffmpeg -i input.mp4 -hide_banner
轉(zhuǎn)換編碼格式(transcoding)指的是, 將視頻文件從一種編碼轉(zhuǎn)成另一種編碼。比如轉(zhuǎn)成 H.264 編碼,一般使用編碼器libx264
,所以只需指定輸出文件的視頻編碼器即可。
$ ffmpeg -i [input.file] -c:v libx264 output.mp4
下面是轉(zhuǎn)成 H.265 編碼的寫法。
$ ffmpeg -i [input.file] -c:v libx265 output.mp4
轉(zhuǎn)換容器格式(transmuxing)指的是,將視頻文件從一種容器轉(zhuǎn)到另一種容器。下面是 mp4 轉(zhuǎn) webm 的寫法。
$ ffmpeg -i input.mp4 -c copy output.webm
上面例子中,只是轉(zhuǎn)一下容器,內(nèi)部的編碼格式不變,所以使用-c copy
指定直接拷貝,不經(jīng)過轉(zhuǎn)碼,這樣比較快。
調(diào)整碼率(transrating)指的是,改變編碼的比特率,一般用來(lái)將視頻文件的體積變小。下面的例子指定碼率最小為964K,最大為3856K,緩沖區(qū)大小為 2000K。
$ ffmpeg -i input.mp4 -minrate 964K -maxrate 3856K -bufsize 2000K output.mp4
下面是改變視頻分辨率(transsizing)的例子,從 1080p 轉(zhuǎn)為 480p 。
$ ffmpeg -i input.mp4 -vf scale=480:-1 output.mp4
有時(shí),需要從視頻里面提取音頻(demuxing),可以像下面這樣寫。
$ ffmpeg -i input.mp4 -vn -c:a copy output.aac
上面例子中,-vn
表示去掉視頻,-c:a copy
表示不改變音頻編碼,直接拷貝。
添加音軌(muxing)指的是,將外部音頻加入視頻,比如添加背景音樂或旁白。
$ ffmpeg -i input.aac -i input.mp4 output.mp4
上面例子中,有音頻和視頻兩個(gè)輸入文件,F(xiàn)Fmpeg 會(huì)將它們合成為一個(gè)文件。
下面的例子是從指定時(shí)間開始,連續(xù)對(duì)1秒鐘的視頻進(jìn)行截圖。
$ ffmpeg -y -i input.mp4 -ss 00:01:24 -t 00:00:01 output_%3d.jpg
如果只需要截一張圖,可以指定只截取一幀。
$ ffmpeg -ss 01:23:45 -i input -vframes 1 -q:v 2 output.jpg
上面例子中,-vframes 1
指定只截取一幀,-q:v 2
表示輸出的圖片質(zhì)量,一般是1到5之間(1 為質(zhì)量最高)。
裁剪(cutting)指的是,截取原始視頻里面的一個(gè)片段,輸出為一個(gè)新視頻??梢灾付ㄩ_始時(shí)間(start)和持續(xù)時(shí)間(duration),也可以指定結(jié)束時(shí)間(end)。
$ ffmpeg -ss [start] -i [input] -t [duration] -c copy [output]$ ffmpeg -ss [start] -i [input] -to [end] -c copy [output]
下面是實(shí)際的例子。
$ ffmpeg -ss 00:01:50 -i [input] -t 10.5 -c copy [output]$ ffmpeg -ss 2.5 -i [input] -to 10 -c copy [output]
上面例子中,-c copy
表示不改變音頻和視頻的編碼格式,直接拷貝,這樣會(huì)快很多。
有些視頻網(wǎng)站只允許上傳視頻文件。如果要上傳音頻文件,必須為音頻添加封面,將其轉(zhuǎn)為視頻,然后上傳。
下面命令可以將音頻文件,轉(zhuǎn)為帶封面的視頻文件。
$ ffmpeg -loop 1 -i cover.jpg -i input.mp3 -c:v libx264 -c:a aac -b:a 192k -shortest output.mp4
上面命令中,有兩個(gè)輸入文件,一個(gè)是封面圖片cover.jpg
,另一個(gè)是音頻文件input.mp3
。-loop 1
參數(shù)表示圖片無(wú)限循環(huán),-shortest
參數(shù)表示音頻文件結(jié)束,輸出視頻就結(jié)束。
(完)
聯(lián)系客服