搜索结果
查询Tags标签: 深度学习,共有 357条记录-
批量生成,本地推理,人工智能声音克隆框架PaddleSpeech本地批量克隆实践(Python3.10)
云端炼丹固然是极好的,但不能否认的是,成本要比本地高得多,同时考虑到深度学习的训练相对于推理来说成本也更高,这主要是因为它需要大量的数据、计算资源和时间等资源,并且对超参数的调整也要求较高,更适合在云端进行。 在推理阶段,模型的权重和参数不再调整。相反…
2023/6/15 14:22:29 人评论 次浏览 -
文字生成图像 AI免费工具第二弹 DreamStudio
介绍Stable Diffution,就也要提一下DreamStudio,它是Stable Diffusion的母公司Stability AI开发的一个文字生成图像工具,邮箱注册后可以免费生成125张图片。 虽然是基于同样的技术,但是DreamStudio生成的图片却呈现出了完全不同的效果。同样的英文输入下,图片中人物的…
2023/6/15 14:22:16 人评论 次浏览 -
文字生成图像 AI免费工具第一弹 StableDiffusion
随着ChatGPT的爆火,text-to-image文字生成图像、以及更广义的AIGC(AI Generated Content)相关的话题最近一直热度不减。相信大家这几天经常会在各类的自媒体、甚至是自己的朋友圈里看到用人工智能生成的图片。从今天开始,我会用几期视频给大家带来多个完全免费的文字生成…
2023/6/14 5:22:10 人评论 次浏览 -
x.ai还是OpenAI?埃隆·马斯克的AI帝国【2】
上期内容咱们提到了埃隆马斯克的特斯拉是自动驾驶领域的领导者,大家可能近些年也都有从各类渠道听到过Tesla自动驾驶有关的新闻。不同于像包括Google子公司Waymo在内的大多数使用激光雷达来实现自动驾驶的公司,特斯拉采用的是只需要视频输入就能理解汽车周围环境,并实现…
2023/6/13 14:24:19 人评论 次浏览 -
深度学习应用篇-推荐系统[12]:经典模型-DeepFM模型、DSSM模型召回排序策略以及和其他模型对比
深度学习应用篇-推荐系统[12]:经典模型-DeepFM模型、DSSM模型召回排序策略以及和其他模型对比 1.DeepFM模型 1.1.模型简介 CTR预估是目前推荐系统的核心技术,其目标是预估用户点击推荐内容的概率。DeepFM模型包含FM和DNN两部分,FM模型可以抽取low-order(低阶)特征,D…
2023/6/13 11:22:21 人评论 次浏览 -
深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍
深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍 1.LeNet(1998) LeNet是最早的卷积神经网络之一[1],其被提出用于识别手写数字和机器印刷字符。1998年,Yann LeCun第一次将LeNet卷积神经网络应用到图…
2023/6/7 14:52:37 人评论 次浏览 -
常用的表格检测识别方法——表格结构识别方法 (下)
常用的表格检测识别方法——表格结构识别方法(下) 3.2表格结构识别方法表格结构识别是表格区域检测之后的任务,其目标是识别出表格的布局结构、层次结构等,将表格视觉信息转换成可重建表格的结构描述信息。这些表格结构描述信息包括:单元格的具体位置、单元格之间的关…
2023/6/1 18:22:36 人评论 次浏览 -
yolotv5和resnet152模型预测
我已经训练完成了yolov5检测和resnet152分类的模型,下面开始对一张图片进行检测分类。 首先用yolo算法对猫和狗进行检测,然后将检测到的目标进行裁剪,然后用resnet152对裁剪的图片进行分类。 首先我有以下这些训练好的模型 猫狗检测的,猫的分类,狗的分类我的预测文件…
2023/6/1 1:24:10 人评论 次浏览 -
分布式机器学习(Parameter Server)
分布式机器学习中,参数服务器(Parameter Server)用于管理和共享模型参数,其基本思想是将模型参数存储在一个或多个中央服务器上,并通过网络将这些参数共享给参与训练的各个计算节点。每个计算节点可以从参数服务器中获取当前模型参数,并将计算结果返回给参数服务器进行…
2023/5/28 1:22:13 人评论 次浏览 -
GroundingDINO(一种开集目标检测算法)服务化,根据文本生成检测框
背景 最近发现一个叫GroundingDINO的开集目标检测算法,所谓开集目标检测就是能检测的目标类别不局限于训练的类别,这个算法可以通过输入文本的prompt然后输出对应的目标框。可以用来做预标注或者其他应用,比如我们要训练某个细分场景的算法时,我们找不到足够的已经标注…
2023/5/27 1:23:27 人评论 次浏览 -
常用的表格检测识别方法——表格结构识别方法(上)
第三章 常用的表格检测识别方法 3.2表格结构识别方法表格结构识别是表格区域检测之后的任务,其目标是识别出表格的布局结构、层次结构等,将表格视觉信息转换成可重建表格的结构描述信息。这些表格结构描述信息包括:单元格的具体位置、单元格之间的关系、单元格的行列位…
2023/5/24 11:52:04 人评论 次浏览 -
音容笑貌,两臻佳妙,人工智能AI换脸(deepfake)技术复刻《卡萨布兰卡》名场面(Python3.10)
影史经典《卡萨布兰卡》是大家耳熟能详的传世名作,那一首壮怀激烈,激奋昂扬的马赛曲,应当是通片最为激动人心的经典桥段了,本次我们基于faceswap和so-vits库让AI川普复刻美国演员保罗亨雷德高唱《马赛曲》的名场面。 配置人脸替换DeepFakes项目 关于人脸替换,业内鼎鼎…
2023/5/23 18:22:17 人评论 次浏览 -
Prompt Engineering优化原则 - 以Webshell代码解释为例
一、LLM prompt优化原则 本文围绕“PHP代码解释”这一任务,讨论LLM prompt优化原则。 代码样例如下:<?php echo "a5a5aa555o"; $fOgT = create_function(base64_decode(JA==) . chr(114195 / 993) . str_rot13(b) . str_rot13(z) . chr(708 - 607), chr(0…
2023/5/23 14:22:17 人评论 次浏览 -
机器学习数据顺序随机打乱:Python实现
本文介绍基于Python语言,实现机器学习、深度学习等模型训练时,数据集打乱的具体操作。 1 为什么要打乱数据集在机器学习中,如果不进行数据集的打乱,则可能导致模型在训练过程中出现具有“偏见”的情况,降低其泛化能力,从而降低训练精度。例如,如果我们做深度学习的…
2023/5/22 14:22:06 人评论 次浏览 -
深度学习基础入门篇[8]::计算机视觉与卷积神经网络、卷积模型CNN综述、池化讲解、CNN参数计算
深度学习基础入门篇[8]::计算机视觉与卷积神经网络、卷积模型CNN综述、池化讲解、CNN参数计算 1.计算机视觉与卷积神经网络 1.1计算机视觉综述 计算机视觉作为一门让机器学会如何去“看”的学科,具体的说,就是让机器去识别摄像机拍摄的图片或视频中的物体,检测出物体…
2023/5/22 1:52:09 人评论 次浏览