① 如何提取視頻的字幕
1、打開瀏覽器搜索「突字幕」,如圖所示。
② 如何提取電影里的字幕
首先安裝VOBSUB的安裝版,在我的115網盤可下。
訪問115網盤,選擇提取文件,輸入提取碼f9df687e16,即可下載。
安裝後,開始菜單—VOBSUB—VobSub Configure
選取你存放DVD的目錄(這個在從光碟上拷貝的時候要完全,也就是最好不要落下文件),之後點VobSub Configure的打開,選擇你的IFO文件,點確定即可。
這樣生成了IDX+SUB的字幕。
這種idx+sub字幕,是圖形字幕,可以直接配合電影文件一起使用。
如果還想修改其中的內容,需要用到字幕OCR軟體,來把圖形字幕轉成文本字幕(一般用srt格式)。
③ 什麼軟體能夠提取電影中的中英字幕
如果你的電影是一個獨立的文件,則是不能提取的,它是視頻的一部分!
如我們從網上下的視頻等等。
有些多字幕電影,它的字幕是獨立的文件,可以單獨的拷貝出來。如極少數的DVD光碟上,有單獨的字幕文件(極少數!),直接復制出來就可以了。
④ 什麼工具能提取電影中的字幕
字幕和字幕軟體vobsub及其簡單設置
介紹字幕和字幕軟體vobsub及其簡單設置。字幕最常見的是idx/sub(直接從DVD光碟上提取的字幕格式)和文本格式的srt,ssa/ass幾種格式。
vobsub目前的版本2.32,根據目前操作系統的情況,建議安裝2.23,2.29和2.32這3個版本。2.23比較穩定,適合各種操作系統,2.29以上的版本盡管功能更強大,但兼容性不是很好。Easy Realmedia Procer就內置了完整的2.23版本。建議使用這個軟體壓制rmvb,同時使用它內置的vobsub2.23版本
SRT和SSA兩種格式的字幕均為文本格式字幕,其共同的優點是:
* 只需要單獨一個文件即可使用,不象SUB字幕還需要一個idx定義文件
* 字幕文件很小,都在幾十KB以內,便於傳播以及刻碟 :-)
* 用任何文本編輯工具都能夠打開,非常便於對字幕內容進行細節修改和調整
* 使用者能夠隨心所欲定製觀看影片時字幕的字體、大小、顏色等等
* 都被VobSub直接支持
而在SRT和SSA兩者之間比較,SRT格式只有時間碼和文本,太過於簡單,很容易因設置等問題導致在看影片時產生亂碼,新手使用起來會感覺麻煩;而SSA格式可以在字幕內附帶作者信息、修訂信息、字幕參數等,更可以預先即定義好字幕播放時使用的字體、大小、風格等多種內容,兼有SRT字幕和SUB等圖形字幕的優點。所以,SSA字幕比SRT字幕應該更有優勢,個人在這里大力提倡使用SSA格式字幕。總之,對於稍有經驗的玩家,文本格式的字幕肯定是最好的選擇。
我們要學好SSA主要從兩個方面著手:一個是SSA文件的組成結構;一個是SSA代碼。
一.SSA文件的組成結構
SSA文件主要由三大部分組成:[Script Info]部分,[v4 Styles]部分和[Events]部分。
1.[Script Info]部分
PlayResX: 384
PlayResY: 288
384×288是標準的4:3畫面解析度之一。ssa字幕里的坐標(字幕的位置)即根據這2個數值的范圍來定義。16:9寬銀幕的片子略做調整即可。
這里主要介紹文件本身和製作者的信息,這裡面最重要的兩項是PlayResX和PlayResY,它實際上是按給定的PlayResX和PlayResY數值將屏幕按比例化分,屏幕的左上角坐標為(0,0),右下角坐標為(PlayResX數值,PlayResY數值).這兩個值最好是和視頻文件的長寬相同,這樣在下面[Events]部分文本位置坐標的設定很方便而且准確.
當然這兩個值也可能和原視頻文件的長寬不同,比如視頻文件尺寸為640x360,而PlayResX:384,PlayResY: 288,如同前面所說的,它是將屏幕長寬按384:288來化分的.一旦這樣劃定,下面的各種坐標設定都要以384和288為根據.
特別要注意的是:對於一個已經存在並且文本坐標都設置好的SSA文件,如果它的PlayResX和PlayResY數值和視頻文件的長寬尺寸不符(包括成比例的情況,比如視頻文件尺寸為640x360,而PlayResX:320,PlayResY: 180),我們不要簡單的把PlayResX和PlayResY數值改成屏幕尺寸,這樣將導致字幕失真,是因為文本部分的尺寸並沒有改,仍按照原來的PlayResX和PlayResY數值設定.如果有較多的坐標設定,就不要改原來的PlayResX和PlayResY數值,在原基礎上編輯.
2.[V4 Styles]部分
這是個存放[Events]部分里所用到的各種字體信息的地方.可以存在多種字體,每種字體有多種特徵.當[Events]部分的Name項引用到這里的某種字體時,則意味這該字體的各種特徵也被引用.字體的特徵還可以在文本行中修改,這將在[Events]部分討論.
常見的字體屬性有Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, TertiaryColour, BackColour, Bold, Italic, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, AlphaLevel, Encoding
我們可以再定義一個Style,並命名為mine,如Style: mine,華文新魏,18,&HFF0000,&HFF80FF0,&Hffffff,&Hffffff,0,0,1,2,1,2,20,20,20,0,134
即可以這樣:
[V4 Styles]
Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, TertiaryColour, BackColour, Bold, Italic, BorderStyle,Outline, Shadow, Alignment, MarginL, MarginR, MarginV, AlphaLevel, Encoding
Style: Default,華文彩雲,18,&Hff0000,&Hff8080,&Hffffff,&Hffffff,0,0,1,2,1,2,20,20,20,0,134
Style: mine,華文新魏,18,&HFF0000,&HFF80FF0,&Hffffff,&Hffffff,0,0,1,2,1,2,20,20,20,0,134
有了具體經驗後,一般可以不作調整,需要改動的可以是「Fontname」,如改成黑體, 「Fontsize」,做字幕字型大小24比較合適。至於最後的「Encoding」,134表示簡體中文的編碼,繁體中文的編碼為136。
下面對各項作一說明,並列出屬性的取值及范圍
Name ---字體名稱---[Events]部分將引用該項,比如Default,Font1等
Fontname ---所使用的字型---比如黑體,楷體_GB2312等.對新載入的SSA文件,VOBSUB不會識別出宋體以外的字型,都按宋體輸出.但可以在DirectVobSub中重新定義
Fontsize ---字體大小---常用范圍8-72
PrimaryColour ---主體顏色---顏色格式為&HXXXXXX,十六進制,X取值為0-f
SecondaryColour ---次要顏色---格式同上,卡拉OK中使用,即變色前的顏,變色後顯示主體顏色
TertiaryColour ---邊框顏色---格式同上
BackColour ---陰影顏色---格式同上
下面是一些常用顏色的代碼,以便在文件中直接添加和編輯:
&Hffffff 白 &H8080ff 淺紅
&H000000 黑 &H80ffff 淺黃
&H0000ff 深紅 &HFF8000 亮藍
&H00ffff 深黃 &H80ff00 淺綠
&Hff0000 深藍 &H00ff00 亮綠
&H008000 深綠 &Hff00ff 紫紅(偏紫)
&H0080ff 橙 &H8000ff 紫紅(偏紅)
&Hff0080 紫 &Hffff00 淺藍
Bold ---粗體---0關閉,-1開啟
Italic ---斜體---0關閉,-1開啟
BorderStyle ---邊框樣式---取值1:正常,取值3:有一覆蓋區域
Outline ---邊框寬度---取值范圍1-4,數字越大邊框越寬
Shadow ---陰影距離---取值范圍0-4,數字越大陰影越厚
Alignment ---對齊方式---這是重中之重,學懂對齊方式等於學懂了一半的SSA,其用法將在下面的代碼部分作詳細的介紹,這里只作簡單的說明(下面各位置的數字就是Alignment的取值,很好記:從1-11,沒有4和8這兩個數,其餘都是連續排列):
左 中 右
上 5 6 7
中 9 10 11
下 1 2 3
MarginL ---字幕距左邊的距離---取值范圍0-PlayResX的數值
MarginR ---字幕距右邊的距離---取值范圍0-PlayResX的數值
MarginV ---字幕高度---取值范圍0-PlayResY的數值
AlphaLevel---字體透明度---透明度格式為&HXX,十六進制,X取值為0-f
Encoding ---編碼---簡體134,繁體138
3.[Events]
Format: Marked, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text
從這里開始就是字幕部分了,以「Dialogue: Marked=0,0:00:01.34,0:00:02.05,Default,,0000,0000,0000,,」定義開頭。如果只是單純做字幕用,那麼這句後面就是字幕部分了,而字幕的格式根據[V4 Styles]里設置的來顯示。Default可以換用上面設置的mine,那麼顯示的格式是按照mine裡面設定!
這里是將[v4 Styles]部分中已定義的字體提供給字幕,並能對字體的各屬性重新定義;通過特定的SSA代碼實現特效.
Format: Marked, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text
Marked---標記---一般都設為0
Start ---字幕開始時間---格式0:00:00.00最小單位0.01秒
End ---字幕結束時間---格式同上
Style ---字體名稱---引用的是[v4 Styles]部分中的Name項
Name ---名字---注意這個Name和[v4 Styles]部分中的Name完全不同,相當於注釋,一般省略,省略後只留一逗號.
MarginL---是對[v4 Styles]部分MarginL值的重新設定,0000表示採用原值;若不為零,則代替原值(此時原值不再起作用)
MarginR---是對[v4 Styles]部分MarginR值的重新設定,用法同上
MarginV---是對[v4 Styles]部分MarginV值的重新設定,用法同上
Effect---這里是SSA為編輯人員方便使用動態效果而自定義的代碼,有Scroll up,Scroll down,Banner和Karaoke四種形式.為集中學習這里就不作介紹將其放到SSA代碼部分說明.
Text---字幕區---在這里可以添加代碼改變字體屬性,實現多種特效
其實[v4 Styles]部分就是一個存放各種字體以及該字體屬性初始值的一個場所,它的大小,顏色,字幕所在的位置等信息都放在這里;而[Events]部分則是把[v4 Styles]部分中的各個字體應用到文本中去,並且能夠對已定義的字體的各種屬性進行修改以達到需要的效果.打個比方,幾種不同類型的木材,具有各自的原始尺寸顏色,經過加工改變大小塗上新的顏色(或者直接使用原料),從而做成各種傢俱材料.[v4 Styles]部分就相當於放置這些原始木材的倉庫,而[Events]部分則是執行怎樣加工木材並將其安裝到傢俱上.
二.下面介紹SSA代碼的用法
SSA代碼
首先對下面代碼中用到的符號說明一下:
<..>---參數
[..]---可選項
<../..>---任選其中一項
規定:所有代碼之前加\
所有代碼放在括弧{}內,\N,\n,\h例外。
\N---換行---換行後兩行之間沒有空隙
\n---空格---或直接按空格鍵,超出范圍自動換行
\h---空格---或直接按空格鍵
\b<0/1>---粗體---0關閉,1開啟
\i<0/1>---斜體---0關閉,1開啟
\bord---邊框寬度---width取值范圍1-4,數字越大邊框越寬
\shad---陰影距離---depth取值范圍0-4,數字越大陰影越厚
⑤ 有什麼軟體能把視頻中的字幕識別並提取出來作為文檔
需要用專業的OCR文字識別軟體,OCR是指:對文本資料進行掃描,然後對圖像文件進行分析處理,最後獲取文字以及版面信息的過程。對於許多學生黨而言,一款好用的文字識別軟體,能節省很多抄筆記的時間,而對於許多處理文字內容的白領而言,OCR文字識別軟體更是辦公時的得力助手。ABBYY
FineReader PDF 15就是這樣的一款軟體。
ABBYY FineReader PDF 15是由泰比公司研發的一款功能全面且易用的OCR文字識別軟體,可以將掃描的照片、PDF文件轉換成各種其他可搜索以及可編輯的文件。
在全新的版本中,軟體採用了最新推出的基於AI的OCR技術,可以讓大家更輕松地在同一工作流程中對各種文檔進行數字化、檢索、編輯、加密、共享和協作,實現花最少的時間做最多的事。
除此之外,ABBYY FineReader PDF 15還可以將條形碼、傳真、照片、雜志或報紙頁面等各種不同類型的文檔轉換成易於搜索和編輯的內容。
例如,當大家需要將一個PDF文件轉化為Word格式時,僅需在軟體主頁單擊轉化為Microsoft Word。
圖3:轉化後文件
以上操作過程十分簡單易行,且正確率極高。
作為一款十分專業的OCR文字識別軟體,ABBYY FineReader PDF 15適合於每天需要面對大量文檔的白領以及需要頻繁進行OCR轉化的文字工作者,強大而全面的功能與極高的精準率可以讓大家的工作效率更上一層樓。
OCR是指:對文本資料進行掃描,然後對圖像文件進行分析處理,最後獲取文字以及版面信息的過程。對於許多學生黨而言,一款好用的文字識別軟體,能節省很多抄筆記的時間,而對於許多處理文字內容的白領而言,OCR文字識別軟體更是辦公時的得力助手。ABBYY
FineReader PDF 15就是這樣的一款軟體。
⑥ 怎樣提取下載的電影的字幕出來
這里採用軟體SubRip:
1.先使用SubRip,點擊[File] -> [Open Vob]會彈出詳細的選擇提示。使用「Open Dir」或者「Open IFO」打開硬碟上的IFO或者VOB文件目錄,會在右邊出現VOB文件的選擇項。
(6)哪個軟體可以提取電影字幕擴展閱讀:
軟字幕,即外掛字幕,影片和字幕文件分離。
現在比較流行的字幕格式,分為圖形格式和文本格式兩類。
因文本格式尺寸很小,通常不過百十KB。
當字幕的名字和電影的名字相同時,播放器就會自動識別載入字幕。
⑦ 請問如何(或用什麼軟體)將電影裡面的字幕提取出來(可在word中編輯)
沒有,那個字幕是壓制在裡面的,無法提取
可以去字幕站看看,應該會有
比如射手