百度MP3+图片+文字：生成结果文件；（声音58秒，视频59秒，同步性需要进一步优化）

import os

os_sep = os.sep

this_file_abspath = os.path.abspath(__file__)

this_file_dirname, this_file_name = os.path.dirname(this_file_abspath), os.path.abspath(__file__).split(os_sep)[

    -1]

f_mp3 = '{}{}{}'.format(this_file_dirname, os_sep, 'auido.mp3')

from playsound import playsound

import time

import math

this_time = time.time()

# playsound(f_mp3)

# t_spend = time.time() - this_time

t_spend = 58.777058839797974

# 音频的秒数

t_spend = math.ceil(t_spend)

import cv2

import glob

'''

python+opencv视频图像相互转换 - CSDN博客 https://blog.csdn.net/m0_37733057/article/details/79023693

链接：https://www.zhihu.com/question/49558804/answer/343058915

OpenCV: Drawing Functions in OpenCV https://docs.opencv.org/3.1.0/dc/da5/tutorial_py_drawing_functions.html

'''

# 每秒传输帧数(Frames Per Second)

fps = 100  # 保存视频的FPS，可以适当调整 FPS是图像领域中的定义，是指画面每秒传输帧数，通俗来讲就是指动画或视频的画面数。FPS是测量用于保存、显示动态视频的信息数量。每秒钟帧数愈多，所显示的动作就会愈流畅。通常，要避免动作不流畅的最低是30。某些计算机视频格式，每秒只能提供15帧。

fps = 15

fps = 5

fourcc = cv2.VideoWriter_fourcc('M', 'J', 'P', 'G')  # opencv3.0

f_v = '{}{}'.format(int(time.time()), 'saveVideo.avi')

f_img_d = '{}{}{}{}{}'.format(this_file_dirname, os_sep, 'mypng', os_sep, '*.jpg')

imgs = glob.glob(f_img_d)

img = cv2.imread(imgs[0])

img_size = (img.shape[1], img.shape[0])

videoWriter = cv2.VideoWriter(f_v, fourcc, fps, img_size)

"""

用图片总数均分音频时间

"""

os_delay_factor = 0.14

os_delay_factor = 0.11

myinterval = t_spend / len(imgs) * os_delay_factor

f, l = 'mybaidu.parp.txt', []

with open(f, 'r', encoding='utf-8') as fr:

    for i in fr:

        ii = i.replace('\n', '')

        l.append(ii)

char_loop_l = []

for i in l:

    mystr, le = '', len(i)

    for ii in range(le):

        iii = i[ii]

        print('-----', iii)

        mystr = '{}{}'.format(mystr, iii)

        print(mystr)

        char_loop_l.append(iii)

#

# from fontTools.ttLib import TTFont

# myfont = TTFont('simhei.ttf')

from PIL import Image, ImageDraw, ImageFont

myfont = ImageFont.truetype("simhei.ttf", 50, encoding="utf-8")

import cv2

import numpy as np

os_delay_factor = 0.23

myinterval = t_spend / (len(char_loop_l) * 1) * os_delay_factor

for i in l:

    i_index=l.index(i)

    img_index=i_index%len(imgs)

    imgname=imgs[img_index]

    mystr, le = '', len(i)

    for ii in range(le):

        iii = i[ii]

        print('-----', iii)

        if len(mystr) % 15 == 0:

            mystr = '{}{}'.format(mystr, '\n')

        mystr = '{}{}'.format(mystr, iii)

        print(mystr)

        this_time = time.time()

        while time.time() - this_time < myinterval:

            print(imgname)

            frame = cv2.imread(imgname)

            frame_cv2 = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)

            frame_pil = Image.fromarray(frame_cv2)  # 转为PIL的图片格式

            draw = ImageDraw.Draw(frame_pil)

            font = ImageFont.truetype("simhei.ttf", 50, encoding="utf-8")

            # 第一个参数为字体，中文黑体

            # 第二个为字体大小

            ImageDraw.Draw(frame_pil).text((100, 20), mystr, (0, 0, 255), font)

            '''

                frame_pil:目标图像

                第一个参数为打印的坐标

                第二个为打印的文本

                第三个为字体颜色

                第四个为字体

            '''

            frame_cv2 = cv2.cvtColor(np.array(frame_pil), cv2.COLOR_RGB2BGR)

            img = frame_cv2

            videoWriter.write(img)

videoWriter.release()

原理是将字幕写到图片中，然后再写入视频的帧中

对图片适应

import os, time, glob

import cv2

os_sep = os.sep

this_file_abspath = os.path.abspath(__file__)

this_file_dirname, this_file_name = os.path.dirname(this_file_abspath), os.path.abspath(__file__).split(os_sep)[

    -1]

f_v = '{}{}'.format(int(time.time()), 'saveVideo.avi')

f_img_d = '{}{}{}{}{}'.format(this_file_dirname, os_sep, 'mypng', os_sep, '*.jpg')

imgs, img_size_d = glob.glob(f_img_d), {}

for i in imgs:

    img = cv2.imread(i)

    w_h_s = '{},{}'.format(img.shape[1], img.shape[0])

    if w_h_s not in img_size_d:

        img_size_d[w_h_s] = 1

    else:

        img_size_d[w_h_s] += 1

mode_img_size_wh = [int(i) for i in sorted(img_size_d.items(), key=lambda img_size_d: img_size_d[0], reverse=True)[0][0].split(',')]

import os

os_sep = os.sep

this_file_abspath = os.path.abspath(__file__)

this_file_dirname, this_file_name = os.path.dirname(this_file_abspath), os.path.abspath(__file__).split(os_sep)[-1]

f_mp3 = '{}{}{}'.format(this_file_dirname, os_sep, 'auido.mp3')

from playsound import playsound

import time

import math

this_time = time.time()

# playsound(f_mp3)

# t_spend = time.time() - this_time

t_spend = 58.777058839797974

# 音频的秒数

t_spend = math.ceil(t_spend)

import cv2

import glob

'''

python+opencv视频图像相互转换 - CSDN博客 https://blog.csdn.net/m0_37733057/article/details/79023693

链接：https://www.zhihu.com/question/49558804/answer/343058915

OpenCV: Drawing Functions in OpenCV https://docs.opencv.org/3.1.0/dc/da5/tutorial_py_drawing_functions.html

'''

# 每秒传输帧数(Frames Per Second)

fps = 100  # 保存视频的FPS，可以适当调整 FPS是图像领域中的定义，是指画面每秒传输帧数，通俗来讲就是指动画或视频的画面数。FPS是测量用于保存、显示动态视频的信息数量。每秒钟帧数愈多，所显示的动作就会愈流畅。通常，要避免动作不流畅的最低是30。某些计算机视频格式，每秒只能提供15帧。

fps, fourcc = 15, cv2.VideoWriter_fourcc('M', 'J', 'P', 'G')

# fourcc = cv2.VideoWriter_fourcc('M', 'J', 'P', 'G')  # opencv3.0

videoWriter = cv2.VideoWriter(f_v, fourcc, fps, (mode_img_size_wh[0], mode_img_size_wh[1]))

f_v = '{}{}'.format(int(time.time()), 'saveVideo.avi')

f_img_d = '{}{}{}{}{}'.format(this_file_dirname, os_sep, 'mypng', os_sep, '*.jpg')

imgs = glob.glob(f_img_d)

"""

用图片总数均分音频时间

"""

os_delay_factor = 0.14

os_delay_factor = 0.11

myinterval = t_spend / len(imgs) * os_delay_factor

f, l = 'mybaidu.parp.txt', []

with open(f, 'r', encoding='utf-8') as fr:

    for i in fr:

        ii = i.replace('\n', '')

        l.append(ii)

char_loop_l = []

for i in l:

    mystr, le = '', len(i)

    for ii in range(le):

        iii = i[ii]

        print('-----', iii)

        mystr = '{}{}'.format(mystr, iii)

        print(mystr)

        char_loop_l.append(iii)

#

# from fontTools.ttLib import TTFont

# myfont = TTFont('simhei.ttf')

def resize_rescale_pilimg(img_f, w_h_tuple=(mode_img_size_wh[0],mode_img_size_wh[1]), mid_factor=1):

    img_n,img_type=img_f.split('.')[-2],img_f.split('.')[-1]

    img_type = 'PNG'

    img_f_new = '{}{}{}'.format(img_n, 'resize_rescale.', img_type)

    mid_icon = Image.open(img_f)

    mid_icon_w, mid_icon_h = w_h_tuple[0] * mid_factor, w_h_tuple[1] * mid_factor

    mid_icon = mid_icon.resize((mid_icon_w, mid_icon_h), Image.ANTIALIAS)

    mid_icon.save(img_f_new,img_type)

    return img_f_new

from PIL import Image, ImageDraw, ImageFont

myfont = ImageFont.truetype("simhei.ttf", 50, encoding="utf-8")

import cv2

import numpy as np

os_delay_factor = 0.245

myinterval = t_spend / (len(char_loop_l) * 1) * os_delay_factor

for i in l:

    i_index = l.index(i)

    img_index = i_index % len(imgs)

    imgname = imgs[img_index]

    mystr, le = '', len(i)

    for ii in range(le):

        iii = i[ii]

        print('-----', iii)

        if len(mystr) % 15 == 0:

            mystr = '{}{}'.format(mystr, '\n')

        mystr = '{}{}'.format(mystr, iii)

        print(mystr)

        this_time = time.time()

        while time.time() - this_time < myinterval:

            print(imgname)

            frame = cv2.imread(imgname)

            if (frame.shape[1], frame.shape[0]) != (mode_img_size_wh[0], mode_img_size_wh[1]):

                imgname = resize_rescale_pilimg(imgname)

                frame = cv2.imread(imgname)

            else:

                pass

            frame_cv2 = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)

            frame_pil = Image.fromarray(frame_cv2)  # 转为PIL的图片格式

            draw = ImageDraw.Draw(frame_pil)

            font = ImageFont.truetype("simhei.ttf", 50, encoding="utf-8")

            # 第一个参数为字体，中文黑体

            # 第二个为字体大小

            ImageDraw.Draw(frame_pil).text((100, 20), mystr, (0, 0, 255), font)

            '''

                frame_pil:目标图像

                第一个参数为打印的坐标

                第二个为打印的文本

                第三个为字体颜色

                第四个为字体

            '''

            frame_cv2 = cv2.cvtColor(np.array(frame_pil), cv2.COLOR_RGB2BGR)

            img = frame_cv2

            videoWriter.write(img)

videoWriter.release()

'''

待解决：

0-同一批的图片的尺寸不同

1-视频、音频播放时长的同步系数的自计算

2-

字幕

'''

from PIL import Image

#

#

# logo = 'fugu.png'

# mid_icon = Image.open(logo)

# mid_icon_w, mid_icon_h = mid_icon.size

# mid_factor = 5

# mid_icon_w, mid_icon_h = mid_icon_w * mid_factor, mid_icon_h * mid_factor

# mid_icon = mid_icon.resize((mid_icon_w * 3, mid_icon_h), Image.ANTIALIAS)

# mid_icon.save('fugu.2.png', 'PNG')

百度MP3+图片+文字：生成结果文件；（声音58秒，视频59秒，同步性需要进一步优化）的更多相关文章

一篇文章搞定百度OCR图片文字识别API
一篇文章搞定百度OCR图片文字识别API https://www.jianshu.com/p/7905d3b12104
百度UEditor图片上传或文件上传路径自定义
最近在项目中使用到百度UEditor的图片以及文件上传功能,但在上传的时候路径总是按照预设规则来自动生成,不方便一些特殊文件的维护.于是开始查看文档和源代码,其实操作还是比较简单的,具体如下: 1.百 ...
记录：将图片数据生成 tfrecords 文件并在训练使用时读取
直接用别人的就行了: https://github.com/myCVs/GenTFRecords
图片字节流生成bmp文件
1 BITMAPFILEHEADER bfh;//文件头 2 bfh.bfType=0x4d42; bfh.bfOffBits=sizeof(bfh)+sizeof(BITMAPINFOHEADER) ...
JavaWeb项目生成PDF文件添加水印图片并导出
一.前言首先需要在Maven中添加相应的jar包依赖,若项目没用到Maven,也可自行下载相应所需的jar包(itextpdf.jar 与 itext-asian.jar),如下图所示.点此下载 M ...
多图片生成pdf文件
这里记录多个图片合并生成一个pdf文件的方法. 首先maven引入所需jar包: <dependency> <groupId>com.itextpdf</groupId& ...
Delphi文字转语音TTS【支持选择语音库，播放，暂停，开始，停止，生成语音文件，设置音量，设置语速】
作者QQ:(648437169) 点击下载➨文字转语音TTS [Delphi 文字转语音TTS]调用系统自带的TTS组件,支持XP,vista,win7,win8,win10系统,支持选择语音库,播放 ...
用 Python 简单生成 WAV 波形声音文件
Python 简单生成 WAV 波形声音文件让机器发出声响,本身就是一件充满魔法的事情.有没有想过,用一段简单的代码,生成一个最简单的声音呢?Python 这门脚本语言的库十分丰富,借助于其中的三个 ...
百度开源富文本编辑器 UEditor配置：图片上传和文件上传独立使用方法
使用UEditor编辑器自带的插件实现图片上传和文件上传功能,这里通过配置UEditor单独使用其内置的第三方插件swfupload来实现图片和文件的上传,通过对UEditor配置轻松实现图片批量上传 ...

随机推荐

magento category Ids Name
如何获取产品的分类的名称和ids 1.对于产品的分类ids 的获取 $this->getProduct()->getCategoryIds() 2.对应产品的分类的Name 的 ...
HDU_1520_Anniversary party_树型dp
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1520 Anniversary party Time Limit: 2000/1000 MS (Java ...
js判断是安卓还是 ios webview
判断原理:JavaScript是前端开发的主要语言,我们可以通过编写JavaScript程序来判断浏览器的类型及版本.JavaScript判断浏览器类型一般有两种办法,一种是根据各种浏览器独有的属性来 ...
.Net Core2.2 + EF Core + DI，三层框架项目搭建教程
笔记: 近两年.Net Core发展的很快,目前最新版为3.0预览版,之前在网上买了一本1.1版书籍都还没来得及看呢,估计现在拿出来看也毫无意义了.已多年.net工作经验,看书不如直接实际上手来得快, ...
HDU - 6264 - Super-palindrome（思维）
题意: 给出一个字符串,使得所有的奇数连续子串为回文串,输出最小变化次数思路: 分析过后,只存在两种情况,1全部为一种字母,2形如abab交替类型对于奇数位和偶数位单独计数,只需计算出奇数位或者偶 ...
POJ3616 Milking Time【dp】
Description Bessie is such a hard-working cow. In fact, she is so focused on maximizing her producti ...
【Python实践-9】将字符串转化为浮点型
利用map和reduce编写一个str2float函数,把字符串'123.456'转换成浮点数123.456. 思路:计算小数位数--->将字符串中的小数点去掉--->字符串转换为整数-- ...
js之DOM间接操作
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
洛谷 1328 生活大爆炸版石头剪刀布（NOIp2014提高组）
[题解] 简单粗暴的模拟题. #include<cstdio> #include<algorithm> #include<cstring> #define LL l ...
HDU - 6158 The Designer
传送门:http://acm.hdu.edu.cn/showproblem.php?pid=6158 本题是一个计算几何题——四圆相切. 平面上的一对内切圆,半径分别为R和r.现在这一对内切圆之间,按 ...

百度MP3+图片+文字：生成结果文件；（声音58秒，视频59秒，同步性需要进一步优化）

百度MP3+图片+文字：生成结果文件；（声音58秒，视频59秒，同步性需要进一步优化）的更多相关文章

随机推荐

热门专题