Coze智能体工作流一键生成情感混剪短视频,全流程保姆级教学

Coze智能体工作流一键生成情感混剪短视频,全流程保姆级教学

准备工作

  1. 注册与登录:访问 Coze 智能体平台,完成注册和登录操作。
  2. 素材准备
    • 视频素材:收集各种与情感相关的视频素材,如爱情、友情、亲情等主题的电影片段、电视剧片段、生活记录等。将这些素材存储在本地或对象存储中,并确保 Coze 智能体能够访问到这些素材地址。
    • 音频素材(可选):准备一些适合作为背景音乐的音频文件,如抒情的钢琴曲、轻柔的小提琴曲等,用于增强视频的情感氛围。

工作流设置

  1. 定义用户输入
    • 进入 Coze 智能体工作流设计界面,添加开始节点。
    • 在开始节点中设置参数,包括必填的 “视频标题” 和选填的 “视频文案”。视频标题用于确定视频的主题方向,若不填写视频文案,系统会根据标题通过大模型自动生成情感文案。
  2. 生成情感文案
    • 添加选择器节点,用于判断用户是否上传了文案。
    • 如果用户未上传文案,使用大模型节点根据视频标题生成情感文案。可以在大模型节点中设置相关的提示词,引导生成符合情感风格和主题的文案,比如设定 “你是一名情感专家,请根据‘爱情’主题,创作文案,字数不超过 600 字”。
    • 通过聚合节点,将用户上传的文案或大模型生成的文案赋值给新的变量 “content”。
  3. 生成音频
    • 选用火山的音频生成节点,将上一步得到的 “content” 文案转变为口播音频。
    • 根据需要调节 “speed_ratio” 参数来控制口播的语速,比如设置为 0.9 使语速稍微放缓。同时,选择合适的 “voice_id” 参数来确定音频输出的音色。
    • 使用插件获取音频文件的总时长,供后续步骤使用。
  4. 拆分文案
    • 利用文本处理节点,按照指定的分隔符拆分文案内容。
    • 使用代码节点过滤出文本为空的文案,并将拆分处理后的文案数组进行拼接,确保文案的完整性和准确性。
  5. 文本音频对齐
    • 使用文本音频对齐插件,将新生成的音频与文案进行精确对齐。
    • 在插件中,将音频地址填入 “audio_url” 参数,将拼接后的文案填入 “text” 参数,使文本和音频能够精确匹配,获取每一段文案所对应的音频时间区间。
  6. 随机挑选视频片段
    • 添加代码节点,根据音频的总时长,从素材库中随机挑选出用于混剪的视频片段。
    • 在代码节点中,将准备好的视频素材地址数组 “video_urls” 进行相应的配置,实现从素材库中随机选取合适的视频片段,并返回这些选中视频素材的地址集合。
  7. 构建剪辑元数据
    • 再次添加代码节点,依据之前获取的所有信息来构建剪辑时所需的元数据。
    • 在代码节点中,进行如下配置:“video_urls” 选择前面代码节点中随机生成的视频地址;“timelines” 选择与音频对齐后所生成的时间线对象;“audioUrl” 选择音频生成的结果;“texts” 选择与音频对齐后的输出;“bgm” 可以设定一个默认的背景音乐地址,也可以准备多个背景音乐地址,借鉴随机选择视频的逻辑进行随机选择;“duration” 设定为音频的总时长;“title” 使用开始节点时用户输入的标题。
  8. 自动剪辑
    • 使用 “creat_draft” 创建空白草稿。
    • 依次将视频元信息、字幕元信息、标题字幕元信息、BGM 元信息、配音元信息添加到视频草稿中。
    • 最后使用 “save_draft” 保存草稿,完成自动剪辑操作。
  9. 返回草稿地址
    • 保存后的草稿会生成一个地址,将此地址返回。
    • 可以使用剪映小助手将草稿下载到本地,进行二次创作和微调,如进一步调整剪辑效果、添加特效、字幕样式等,以满足个性化的需求
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。