Conversion de vidéos et de voix en sous-titres SRT à l'aide du modèle Gimine 2.5 Pro

J'ai déjà essayé. Convertissez la parole en sous-titres pour plusieurs locuteurs avec Gemini 2.0 gratuitement ! Les résultats sont notables. J'ai profité de l'occasion pour l'essayer à nouveau avec la Gimine 2.5 pro.

Tout d'abord, nous trouvons un échantillon de sous-titres SRT plus standard comme référence (la synthèse vocale est effectuée à l'avance et le modèle le plus courant sur le marché est utilisé) :

00:00:00,000 --> 00:00:01,480
刚出镜不用文案
00:00:01,480 --> 00:00:03,260
单拍产品就有人下单
00:00:03,260 --> 00:00:04,200
你相信吗
00:00:04,200 --> 00:00:07,070
国内的短视频卖货竞争大、成本高
00:00:07,070 --> 00:00:10,660
海外短视频刚起步、容量大、竞争力度小
00:00:10,660 --> 00:00:12,420
是目前的蓝海市场
00:00:12,420 --> 00:00:15,120
而且海外平台用户面向全球
00:00:15,120 --> 00:00:16,760
买家多、卖家少
00:00:16,760 --> 00:00:18,840
做海外账号涨粉引流
00:00:18,840 --> 00:00:20,920
不用开直播就能带货变现
00:00:20,920 --> 00:00:22,000
无需精通外语
00:00:22,000 --> 00:00:23,100
零基础也能做

 

Essayons d'abord. Convertissez la parole en sous-titres pour plusieurs locuteurs avec Gemini 2.0 gratuitement ! L'article fournit des mots d'incitation pour plusieurs locuteurs qui devraient fonctionner correctement lorsqu'ils sont utilisés pour une seule personne.

使用 Gimine 2.5 Pro 模型将视频、语音转为SRT字幕

Sous-titres en sortie :

[00:00] 小美: 不用出境,不用文案,單拍產品就有人下單,你相信嗎?
[00:04] 小美: 國內的短視頻賣貨,競爭大,成本高。
[00:07] 小美: 海外短視頻剛起步,流量大,競爭力度小,是目前的藍海市場。
[00:12] 小美: 而且海外平台用戶面向全球,買家多,賣家少。
[00:16] 小美: 做海外賬號長粉引流,不用開直播就能帶貨變現。
[00:20] 小美: 無需精通外語,零基礎也能做。
[00:23] [END]

L'indice est mieux adapté aux scénarios d'entretiens conversationnels, retenant toujours les phrases longues et complètes de l'orateur. Les coupures de phrases sont légèrement moins bonnes. Nous concevons ci-dessous un indicateur plus adapté à la génération de sous-titres SRT standard et qui exige des coupures de mots et de phrases précises basées sur le ton.

 

Nouveaux mots-clés

你是一个专业的字幕转录助手。你的任务是将我提供的文件转录为文本,并将转录结果格式化为符合 EBU-STL 标准的 SRT字幕文件。具体要求如下:

## 每个字幕块必须严格按照以下结构输出:

[行号]
[时间行]
[文字行]
[空行]

**该结构的说明**
- [行号] 是字幕块的序号,从 1 开始递增,例如  1、2  等。
- [时间行] 是时间戳,格式为 HH:MM:SS,FFF --> HH:MM:SS,FFF,表示字幕的起始和结束时间(FFF 表示3位毫秒,例如 000 到 999)。如果你无法精确计算时间,可以根据音频内容合理估算,确保时间间隔逻辑合理。
- [文字行] 是转录的文本内容。
- [空行] 是字幕块之间的分隔,确保每个字幕块后有一个空行。

## 限制
输出时,必须严格遵守上述格式,不要省略任何部分,也不要添加多余的文本或注释。
每块字幕的持续时间尽量控制在 3-15 秒之间,具体根据语速和语义自然分割。


现在,请根据我提供的文件进行转录,并按上述格式输出字幕内容。

 

Sous-titres en sortie :

1
00:00:00,327 --> 00:01,187
不用出镜,不用文案,

2
00:01,747 --> 00:03,717
单拍产品就有人下单,你相信吗?

3
00:04,337 --> 00:06,637
国内的短视频卖货竞争大,成本高。

4
00:07,177 --> 00:08,627
海外短视频刚起步,

5
00:09,277 --> 00:10,597
流量大,竞争力度小,

6
00:11,067 --> 00:12,247
是目前的蓝海市场。

7
00:12,707 --> 00:14,637
而且海外平台用户面向全球,

8
00:15,167 --> 00:16,357
买家多,卖家少。

9
00:17,067 --> 00:18,467
做海外账号涨粉引流,

10
00:19,177 --> 00:20,687
不用开直播就能带货变现。

11
00:21,277 --> 00:22,927
无需精通外语,零基础也能做。

 

Sur la longueur de la vidéo et de l'audio qui peut être traitée

Les fichiers audio et vidéo d'une durée d'environ 15 minutes sont plus stables. En théorie, la compression audio et vidéo d'une durée de 1 à 2 heures est conforme à la longueur d'entrée et de sortie, mais les résultats réels sont légèrement moins bons (non testés en profondeur). Un autre point important est que Gimine 2.5 Pro n'est pas adapté à la conversion parole-texte, car plus l'audio est long, plus le temps de "réflexion" est long et plus il est instable.

© déclaration de droits d'auteur
AiPPT

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...