优秀的编程知识分享平台

网站首页 > 技术文章 正文

如何利用Python批量读取视频文件的时间长度?

nanyue 2024-11-20 19:34:43 技术文章 4 ℃

本期的主题是利用Python来实现对视频文件时间长度的读取。

在学习编程语言时,相比较于通过书本来学习知识,我更喜欢通过观看学习视频的方式来进行学习,通过主讲老师的讲解,我能很直观且快速的了解一些知识点,但是这种方式有一点让我感到无趣,因为看视频学习往往需要花费很长的时间,而且看视频过程中大多数时候都是比较枯燥的。由于平时我有另外的工作要做,我需要计划着时间来学习完这些知识点。在刚开始时,我会用很原始的方式将每一集的视频长度记录下来,接着将这一部分知识点所有的视频时间求和,然后根据我的空闲时间来决定需要多久看完这视频。

学习过一段时间后,我通过代码实现了自动读取视频时间的功能

NO.1 开始进入正题

软件:PyCharm Community 2019.1

解释器版本:Python 3.8

第三方库:et_xmlfile-1.01、jdcal-1.2、openpyxl-2.6.2、ffmpeg-e6625ca-20191004-win64-static

第三方库安装过程中并不顺利,后来我直接对这些安装包进行了解压,将“et_xmlfile”、"openpyxl"、"jdcal.py"和“ffmpeg-e6625ca-20191004-win64-static”文件放置在Lib目录下的site-packeges中。


在写代码前需要先导入一些库,以便对文件目录和数据进行存储

import os
import subprocess
import?json??
from?openpyxl?
import?load_workbook,?Workbook

程序的实现思路我将其分为两块:1、读取视频文件目录下的文件名;2、读取视频文件的时间长度。

首先建立一个ReadVideoTime类并设置一些初始化参数:

def __init__(self, abspath, destfile):        
			self.abspath = abspath
			self.destfile = destfile

NO.2 读取视频文件目录下的文件名

实现思路如下:

1、找到所在视频文件目录的地址;

2、读取该目录下的视频文件名;

3、调用Workbook模块建立excel工作表及工作表的存储路径;

def?getvideolist(self):
			address_list = os.path.dirname(os.path.abspath(self.abspath)) + '\\' + self.destfile
			list_filename = os.listdir(address_list) 
			wb = Workbook()        
			path = os.path.dirname(address_list) + '\\'       
			prefix = 'data'        
			surfix = '.xlsx'        
			newfile = prefix + surfix        
			excel_path = path + newfile        
			wb.save(excel_path)       
			return list_filename, excel_path, address_list

NO.3 读取视频文件的时间长度

实现思路如下:

1、获取getvideolist()函数返回的视频文件名、data.xlsx的存储路径、视频文件夹目录地址;

2、调用load_workbook()开开data.xlsx用于将读取的数据存储在工作表中;

3、将表格的表头依次设定为“序号”、“文件名”及“视频时间长度(s)”;

4、读取列表的最大行和列数量,并将除表头以外的单元格值初始化为空;

5、调用windows cmd 运行ffprobe.exe 并用subprocess.Popen

新建一个子进程,将读取到的指定视频的数据转换为json字段;

6、对获取的json字段数据进行逐行读取并转码成字符串;

7、按照表头的设定规则,通过for循环逐个给单元赋值;

def?write_duration_time(self): 
			list_filename, excel_path, address_list = self.getvideolist()        
			wb = load_workbook(excel_path)        
			sht = wb.worksheets[0]        
			sht["A1"] = "序号"        
			sht["B1"] = "文件名"        
			sht["C1"] = "视频时间长度(s)"                
			max_row = sht.max_row????????
			max_col?=?sht.max_column        
			if max_row > 1 and max_col > 0:            
      			for row in sht.iter_rows(min_row=2, min_col=1, max_col=max_col, max_row=max_row):                
            			for cell in row:                    
                  			cell.value = " "???????

			for?index,?filename?in?enumerate(list_filename):            
      			pname = 'E:\\Python批量读取视频时间\\venv\\Lib\\site-packages\\ffmpeg-20191004-e6625ca-win64-static\\bin\\ffprobe.exe -v quiet -print_format json -show_format "%s"' % (address_list + '\\' + filename)           
						# 输出视频文件文件名????????????
     				print((self.abspath?+?'\\'?+?filename))            
						result = subprocess.Popen(pname, shell=True, stdout=subprocess.PIPE).stdout           
						# 逐行读取result内的结果            
      			list_std = result.readlines()            
						str_tmp = ''            
						for item in list_std:                
     				# 将list_std 中的数据转码                
      						str_tmp += bytes.decode(item.strip())            
            json_data = json.loads(str_tmp)            
            dura_time = json_data['format']['duration']????????????
            print('dura_time:', dura_time)            
            #逐行给单元格赋值            
            sht.cell(row=index + 2, column=1, value=index+1)           
            sht.cell(row=index + 2, column=2, value=filename)            
            sht.cell(row=index + 2, column=3, value=dura_time)        
			# 保存工作目录        
      wb.save(excel_path)        
			print("视频时间长度数据获取成功!")
'*** -v quiet -print_format json -show_format "%s"' %(***)

各位读者朋友这一行代码十分有用,可以方便的通过cmd执行程序并将输出的数据转换成想要的类型。


利用Python批量读取视频文件的时间长度的代码就这么实现了,Let‘s go,现在检验下实现的效果吧!

打开想要获取视频文件时间长度的文件目录:

在执行程序时需要按照如下的方式进行文件进的输入:

请输入视频文件路径:E:\\Python中级教程\\视频-Python深入浅出\\day2视频
请输入视频文件夹:day2视频

执行程序后的效果如下:

执行完程序后会在excel_pathd对应的路径下生成一个'data.xlsx'文件。

打开文件后就可以看到视频文件名及对应的视频长度。

- END -

Tags:

最近发表
标签列表