你可以借助 Claude-3 和 Lightning AI,将任何 YT 视频变成内容创作神器。

2024/10/12 21:03:02

本文主要是介绍你可以借助 Claude-3 和 Lightning AI,将任何 YT 视频变成内容创作神器。,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

创建任何视频转文本的LLM产品。直译。

2月20日,Karpathy发布了一段从头开始构建GPT-3分词模型的详尽视频。

一个例子,2小时13分钟的视频 转换成一篇博客文章(包含截图和代码),使用了Claude 3 Opus.

3月4日,Emmanuel Ameisen 和 Erik Schluntz 接受了 Karpathy 的这个挑战,即将视频转换成博客,使用大语言模型,并从同一个 GPT-3 Tokenizer 视频创建了一个博客。

点击这里查看这篇博客。

来自X的帖子链接: https://twitter.com/mlpowered/status/1764718705991442622

今天,我要再进一步。

我正在与Lightning AI合作,帮助人们通过Lightning Studios创建内容制作工具,从任何YouTube视频开始!

开始吧!往下看并创建你的 ↓

使用Claude-3创建任何视频转文本LLM模型 - 由cvetkotim创建的闪电工作室该工作室旨在将YouTube视频转换为Claude-3生成的博客内容。复制到lightning.ai
以下内容将由本文介绍:
  1. 如何实现 PyTube 和 Claude-3 以将任何 YouTube 视频转换成文本 — 完整代码实现
  2. 如何轻松构建任何语音转文本的大型语言模型产品并生成大量内容

➡ 如果您希望将YT视频自动转换为完整内容形式,请点击这里填写表格这里

P1 :行了,给我演示一下这个怎么操作!

此 notebook 提供了重现 Claude-3 在 Karpathy 挑战中的解决方案的基础,该挑战是将一个(个)video tutorial 转换为一篇博客文章。

博客视频工作流程

好的,这样一步步来说明。

  1. 获取Claude-3的API密钥并初始化Anthropic客户端。
  2. 下载YouTube视频及其字幕。
  3. 初始化Whisper模型以进行语音转文本。
  4. 将视频切分为文字和截图对。
  5. 使用Claude-3来填充博客内容。
第一步:获取 Claude-3 的 API 密钥:然后初始化 Anthropic 客户端

从官方网站获取API密钥,以运行这三个可用模型中的任何一个演示。

作者制作,通过API密钥初始化

第二步:下载 YouTube 视频和其字幕文件

我们将使用 Python 中的 pytube 库(来自 YT)先下载视频和音频流,这些音频流稍后会用于 Whisper。

下载YouTube视频和对应的字幕

步骤 3 :初始化 Whisper 模型以转写语音

我们从 _faster_whisper 导入 WhisperModel,将其转录为文本片段,以处理我们的 YouTube 视频内容。

启动Whisper(语音转文字模型)

第4步:将视频切成文本和截图的组合:

现在来谈谈不太有趣的部分。我们需要从pytube和Whisper分别加载视频和文本。为此,最有效的方法是将视频分割成章节。

作者提供的图片:将视频按章节拆分

第五步:用 Claude-3 填写博客

哈!太酷了。现在,我们能把任何YT视频拆分成包含视频和文字的片段,并且可以为这些片段添加LLM语义。我们先来看看Claude-3模型的提示吧。

    prompt_instructions = f"""  
    <指令>  
    您将收到视频在不同时间点的图像,以及由AI语音识别工具生成的转录文本,在<转录>中。  
    该转录文本可能包含一些误差。  
    您的任务是将转录文本转换为Markdown格式的博客文章。  
    请按照以下指南,将转录文本转换为有效的Markdown格式:  
    - 输出有效的Markdown  
    - 根据需要插入部分标题和其他格式  
    - 您只获得了转录文本的一部分,因此不要包含介绍性或结论性段落。只包含转录文本中讨论的主要内容  
    - 使用适当的格式使图片、文本、代码、边注和页面布局看起来像典型的博客文章或教科书  
    - 删除口头语  
    - 如果有冗余信息,请仅呈现一次  
    - 保持原文中对话的风格。使用标题使叙事更易于跟随  
    - 转录文本中包含太多图片,因此请在输出中只包含最重要的1-2张图片  
    - 选择与转录文本相关的插图  
    - 优先展示完整的代码片段,而非部分代码  
    - 当相关时,转录重要的代码片段和其他有价值的文本  
    - 如果图片有助于说明转录文本的一部分,请插入相应的图片  
    - 要包含图片,请在图片数据上方插入一个带有< img class="lazyload" src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAYAAAAfFcSJAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAAAJcEhZcwAADsQAAA7EAZUrDhsAAAANSURBVBhXYzh8+PB/AAffA0nNPuCLAAAAAElFTkSuQmCC" data-original="xxxxx.jpg"/>的标签,其中xxxxx用插入的图片时间戳替换  
    - 不要添加任何多余的资料,仅包括在转录文本或图片中提到的内容  

    您的最终输出应适合放入教科书中。  
    </指令>  
    """

这里是应用到每个块的最终版本,包括Markdown。

作者的图片:最终的For循环在块上

… 这就留下了一篇类似的博客文章,如下所示。真是太酷了!

图片来自作者,就是一个截图。

构建任意视频转文本的大型语言模型产品

好的。能够做到的代码:

  1. 输入任何 YT 视频
  2. 创建章节列表(大纲)
  3. 使用 Claude-3 生成 Markdown

…真的很棒。而且还是自动的。

要从这一步做到构建任何视频转文字的LLM产品都,很简单!只需要改变提示。

如果是博客,为何不内容?这里怎么做:

如果是博客,为什么不内容呢?这里怎么做。

我们将利用提示工程用AI自动生成任何内容。这是我们要用来创建博客的初始提示。

        prompt_instructions = f"""  
        <说明部分>  
        您将获得视频在不同时间戳下的图像,随后是通过AI语音识别工具生成的<转录>文本。  
        转录可能包含许多不准确的信息。  
        您的任务是将转录转换成markdown格式的博客文章。  
        该转录包含许多不准确的信息。您的工作是创建不超过200字符的有效推特或领英帖子,简短快速的句子和学习要点。  
        - 输出有效的markdown格式  
        - 在适当的地方插入章节标题和其他格式,比如列表和粗体  
        - 您只得到了部分转录,因此不要包含引言或结论段落。仅包括转录中讨论的主要话题  
        - 使用样式使图像、文本、代码、标注和页面布局和边距看起来像典型的博客文章或教科书  
        - 删除任何口头语  
        - 如果有冗余的信息,只需呈现一次  
        - 保持转录中的对话内容风格,如口语化表达。包括标题以使叙述结构更容易跟随  
        - 选择与转录相关的插图图像  
        - 尽可能包含显示完整代码的图像,而不是部分代码  
        - 当相关内容重要时,转录重要代码段和其他有价值的文字到帖子中  
        - 不要添加任何额外的信息:仅包含转录或图像中提到的内容  

        您的最终输出应适合包含在教科书中,或发表在博客上。  
        </说明部分>  
        """

我们来把这个家伙调一下,让它直接从 YouTube 视频里提取内容。

      prompt_instructions = f"""  
        <指令>  
        已提供视频不同时间戳的图像,随后是<转录>中的音频转录。  
        转录是由AI语音识别工具生成的,可能存在一些错误或不准确性。  
        转录可能存在一些不准确的地方。你的任务是创建不超过200字符的Twitter/LinkedIn帖子,内容为简短且快速的句子和学习要点。  
        - 输出有效的Markdown格式  
        - 根据需要添加部分标题和其他格式  
        - 你只获得了转录的部分内容,因此不要包含开头或结尾段落。只包括转录中讨论的主要话题  
        - 使用样式使图像、文本、代码、注释和页面布局及边距看起来像典型的博客文章或教科书  
        - 删除口头语  
        - 如果有冗余的信息,只呈现一次  
        - 保持转录中对话内容的风格。包括标题使叙述结构更易于跟随  
        - 选择与转录相关的插图说明  
        - 尽可能包括展示完整代码的图像,而不是正在开发中的代码  
        - 在相关情况下,转录重要的代码片段和其他有价值的文本  
        - 不要添加任何无关信息:只包括在转录或图像中提到的内容  

        最终输出应适合教科书中的内容。  
        </指令>  
        """

我插入了這段來自20VC的視頻,例如。

20VC:Harry Stebbings 和 Kevin Ryan

aaand 得到了这样的内容:(205 行满满的知识)

-> 点击这里查看

作者的图片:blogpost.md 文件由 Claude-3 创建

总结……
  1. 我已经向你展示了如何将任何 YouTube 视频作为输入,做一些预处理,并应用 Claude-3(或任何其他 LLM)来创建内容。
  2. 感谢 Lightning AI,如下可以做到这一点:
  • 获取 Claude-3 的 API 键,
  • 在 Studio 中点击 打开 这个按钮,
  • main.py 运行 Streamlit 应用并进行互动,

我很想知道你要建什么!

➡ 如果您希望自动将YT视频转换为完整内容资料,请填写表格点击这里这里

祝您编程愉快!如果您有任何问题,请随时通过 tim@timcvetko.com 联系我帮忙。

喜歡這個故事嗎?

感谢您读完本文。我的名字是Tim,我从事AI、商业和生物学的交叉领域工作。我喜欢解释机器学习的概念,或写有关商业(如风险投资或宏观经济)的文章!可以通过我的邮箱cvetko.tim@gmail.com联系我。

免费订阅 ,获取我推送的每个新故事的通知。

每当 Tim Cvetko 发布内容时都会收到电子邮件。如果注册,如果没有 Medium 账户,将会为您创建一个。…timc102.medium.com
参考文献:

链接如下:

  • [https://pub.towardsai.net/using-claude-3-to-transform-a-video-tutorial-in-a-blog-post-d2c1e04e7a7b](https://medium.com/用Claude 3将视频教程转化为博客文章-d2c1e04e7a7b)
  • https://github.com/Timothy102/youtube-to-blog/blob/main/blogpost.md
  • https://www.youtube.com/watch?v=RKRJ3-PT3jA


这篇关于你可以借助 Claude-3 和 Lightning AI,将任何 YT 视频变成内容创作神器。的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程