AIGC 知识库

更新:

简介

本知识库旨在分享人工智能 AIGC 相关教程知识,包含但不限于ChatGPT、Midjourney、Stable Diffusion 等产品。

学习资料

Github

  • ChatGPT 中文指南
  • GPTs仓库:看了一下泄漏GPTs Prompts的仓库,算是开了眼界,原来有才华的人是这样写Prompts的。偷师学艺,自己的Prompts又丰富不少
  • LangGPT:人人都可编写高质量 Prompt ,一个结构化提示词的 GPTs。
  • Awesome-ChatGPT :一个ChatGPT资源合集,包含与 ChatGPT 相关的各种工具、文档、集成项目。

模型

  • Hugging Face:你可以将 HuggingFace 理解为 AI 届的 Github。上面会有不少人或组织会将他们的模型分享到上面。你可以通过 HuggingFace 的搜索功能来搜索你想要的模型
  • C 站:与 HuggingFace 不同,CivitAI 站点更偏向于 UGC 一些,所以你会看到更多个人训练的模型,但是这并不意味着它们的质量会差,相反,你会发现有些模型的质量非常好。而且 CivitAI 比 HuggingFace 多了很多好用的功能,比如你可以通过筛选等方式,看到各种各样优秀的模型
  • Hugging Face:大型的模型资源网
  • 吐司:国人的AI模型网站,里面的资源符合大多数国人审美
  • CGSociety:CG模型参考网站,海量的模型
  • A站:CG艺术分享网站,可以参考,垫图素材库
  • 微元素:CG网站,可作三维绘图的参考

网站

  • Comflowy – ComfyUI 社区:探索 ComfyUI 的无限可能,致力于以 ComfyUI 和 Stable Diffusion 为核心,打造更优质的生产工具、构建开发者与用户内容社区。
  • Fooocus:专注于提示和生成
  • StableDiffusionBook:关于 Ai 绘画的Wiki
  • StartAI:是一款专为设计师打造的基于Photoshop的AI工具,轻松
    提升你的设计效率,激发无限创意

X(Twitter)

  • @nickfloats:公开探索 AI 并分享学习成果,每日玩转 Midjourney 和 NeRFs
  • 宝玉:Prompt Engineer,致力于学习和传播有关人工智能、软件工程和工程管理的知识。
  • 归藏: AI 知识每周都发布在 AIGC Weekly 周刊,主要内容是上周 AI 领域的重点动态解析以及相关的产品和文章
  • DynamicWang:AW Portrait模型的作者,推特上经常分享制作流程

Telegram

  • AI Copilot:由一名医学生维护的关于 AI 的非营利频道

语雀

飞书 / Lark(国际版飞书)

  • 🌈通往 AGI 之路:要实现通用人工智能(AG)也许有很长的路要走,我们的目标是让每个人的学习过程少走弯路,让更多的人因 AI 而强大。

Bilibili

Stable Diffusion

介绍

Stability AI 是全球领先的开源生成式人工智能公司,提供突破性的开放式人工智能模型。

官网 & 社媒
官网X 、DiscordYoutube

第三方
Stable Diffusion Web UI Github
严格意义上来说是一个基于Stable Diffusion的开源项目。这个项目非常强大,把原本很难安装配置的开源项目做成了一个简单易操作的网页,后来又引入了插件系统,可以玩出很多花样。最重要的是这一切都免费且开源。

界面基础

了解UI界面

文生图 (txt2img):根据文本提示生成图像

图生图 (img2img):根据提供的图像作为范本、结合文本提示生成图像

更多 (Extras):优化(清晰、扩展)图像

图片信息 (PNG Info):显示图像基本信息,包含提示词和模型信息(除非信息被隐藏)

模型合并 (模型合并):把已有的模型按不同比例进行合并生成新模型

训练 (Train):根据提供的图片训练具有某种图像风格的模型

提示词 (Prompt)

提示词又称为咒语,分为两个类型:正面和负面。

正面提示词 (Prompt)
就是你希望出现在画面中的东西,描述的越详细,越能达到你想要的效果。

负面提示词 (Negative Prompt)
就是你不希望出现在画面中的东西。

💡加不加负面提示词,对于整个图片的品质有很大的影响

尺寸 & 生成数量

Width( 宽)、Height (高)并非越大越好,使用默认的512×512即可,因尺寸越大,对电脑的配置要求越高、生成的图片速度越慢。

生成批次 (Batch Count):每次生成图像的批数,一次运行生成图像的数量为生成批次 * 每批数量
每批数量 (Batch Size):同时生成多少个图像的意思,除 4090 等高级显卡以外通常保持为 1

采样步数 (Sampling Steps)

Stable Diffusion文生图的原理是通过从充满噪声(noise)的画布开始逐渐对其进行降噪处理,以达到最终输的图像效果。而采样步数这一参数就是用来控制去噪步骤数的。通常情况下该数值越高越好,但一般情况下我们使用的25的采样步数值就足以生成任何类型的图像了,而更多的采样步数产生的效果几乎很难看出差别,反而会浪费GPU资源。

以下为一些采样步数的使用技巧:

  • 如果你在试验你的提示词,想快速产生新的图像来查看是不是你想要的效果,以便继续调整你的提示词输入, 你可以将采样步数值设为10-15,因为在这个区间下的采样步数已经能够大致代表最终的效果了;
  • 如果你试验时发现效果还不错,想得到你喜欢的提示词产生的最终效果图了,那你可以将采样步数调整到 25;
  • 如果你生成一张写实的脸部或者动物毛发等这一类具有精细纹理、质感等的图片,并且你觉得25的采样步数下还是缺少一定的细节,那不妨将尝试将该参数值调整到40,可能会有更好的效果。

采样器 (Samplers)

简单来说,采样器是一种算法,在每一步之后获取生成的图像,并将其与文本提示要求的内容进行比较后进行一些更改,直到逐渐达到与文本描述相匹配的图像。

在SD上,我们最常用的采样器有dpm系列和euler系列,其中dpm系列会有更加接近真实世界的效果,euler系列会让真实感减弱同时更加富有艺术感。

采样器的采用没有具体的规则,需要根据自己想要的效果以及提示词的内容来进行选择。

CFG Scale (提示词相关性)

用来调整图像与提示词的相关性,该值越高,提示词对最终生成结果的影响越大,相关性越高, 但它也在一定程度上降低了图像质量,可以用更多的采样步骤来抵消。过高的CFG Scale体现为粗犷的线条和过锐化的图像,越低的值产生越有创意的结果,比如3。但是如果太低,例如1,那提示词就完全没用了,我
一般在设置在7-12。

SD中该参数默认的值为7,它在提示词与创造力之间取得了一个均衡的效果,所以我们一般也不会去改变该数值。

通常不建议该值低于5,因为这样会使图片看起来更像是幻觉一样;该值如果过高而你的提示词又不够详细的话,就并不一定能让生成的图像贴合提示词了,高于6时就可能开始给图像带来很多难看的效果。

那么什么时候使用不同的CFG比例值呢?以下提供了几个范围参考,每个范围适用于不同的提示词和想要达成的图像效果。

  • CFG 2一6:图片很会有创意, 但也可能非常扭曲奇怪。该范围下对于对于简短的提示可能很有趣并且很有用。
  • CFG 7一10:推荐用于大多数提示词。该范围下,创造力和提示词之间会有一个良好平衡。
  • CFG 10一15:当你非常清楚你希望最终生成的图像是什么样子,并且你的提示词对于你想要的图像有一个很详细的描述时,你可以选择该范围。
  • CFG 16一20:一般不推荐,除非你的提示词非常详细。否则可能会严重影响生成图片的质量。
  • CFG>20:该范围下几乎无法使用。

种子 (Seed)

在采样器中我们提到了噪声,而种子的数字就决定了图像生成的初始随机噪声,在我们的提示词完全相同的时候, 生成的图像时常也会很大的差别,就是因为你选择不同的种子,或者将种子的值默认为了随机值(-1)。反之如果我们采用相同的提示词和种子时,会生成很类似的图像。