Modelscope-Sora

Modelscope-Sora Challenge 第四名解决方案

主要思路是先对视频进行处理，包括场景分割，时长过滤，美学评分过滤，运动评分过滤；然后对视频的描述进行生成，先使用MiniCPM 用指定prompt生成 caption，然后进行Unicode修复，单词重复过滤，然后进行训练。其中DataJuicer部分使用Data-Juicer: A One-Stop Data Processing System for Large Language Models进行处理

视频处理

1.1 场景分割

使用 PySceneDetect 的 ContentDetector 将视频拆分为场景剪辑。这样可以更精细地处理视频内容。

1.2 时长过滤

保留视频时长在 3 到 10 秒之间的数据样本。这是为了确保视频长度适中，既不太短也不太长。

1.3 时长进一步处理

移除不符合时长要求的视频,并更新文本中的占位符。这确保了数据集的一致性。

1.4 美学评分过滤

根据从视频中提取的帧图像的美学评分过滤样本。保留视觉效果更好的视频。

1.5 运动评分过滤

计算视频的运动分数，并保留分数在特定范围内的样本。筛选出动态效果适中的视频。

文本处理

2.1 MiniCPM 生成 caption

使用 MiniCPM-V-2_6 模型为视频生成描述。代码借鉴自 https://huggingface.co/openbmb/MiniCPM-V-2_6

2.2 Unicode 修复

修复文本中的 Unicode 错误,删除重复的句子,并过滤单词重复比例超出特定范围的文本。提高文本质量和多样性。

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
src		src
1_scene_split.yaml		1_scene_split.yaml
2_duration_filter.yaml		2_duration_filter.yaml
3_duration_process.py		3_duration_process.py
4_aes_filter.yaml		4_aes_filter.yaml
5_motion_filter.yaml		5_motion_filter.yaml
6_minicpm.py		6_minicpm.py
7_unicode.yaml		7_unicode.yaml
README.md		README.md
requiements.txt		requiements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Modelscope-Sora

视频处理

1.1 场景分割

1.2 时长过滤

1.3 时长进一步处理

1.4 美学评分过滤

1.5 运动评分过滤

文本处理

2.1 MiniCPM 生成 caption

2.2 Unicode 修复

About

Releases

Packages

Languages

simplaj/Modelscope-Sora

Folders and files

Latest commit

History

Repository files navigation

Modelscope-Sora

视频处理

1.1 场景分割

1.2 时长过滤

1.3 时长进一步处理

1.4 美学评分过滤

1.5 运动评分过滤

文本处理

2.1 MiniCPM 生成 caption

2.2 Unicode 修复

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages