AIGC 知识库

更新:

2024年4月13日

简介

本知识库旨在分享人工智能 AIGC 相关教程知识，包含但不限于ChatGPT、Midjourney、Stable Diffusion 等产品。

学习资料

Github

ChatGPT 中文指南
GPTs仓库：看了一下泄漏GPTs Prompts的仓库，算是开了眼界，原来有才华的人是这样写Prompts的。偷师学艺，自己的Prompts又丰富不少
LangGPT：人人都可编写高质量 Prompt ，一个结构化提示词的 GPTs。
Awesome-ChatGPT ：一个ChatGPT资源合集，包含与 ChatGPT 相关的各种工具、文档、集成项目。

模型

Hugging Face：你可以将 HuggingFace 理解为 AI 届的 Github。上面会有不少人或组织会将他们的模型分享到上面。你可以通过 HuggingFace 的搜索功能来搜索你想要的模型
C 站：与 HuggingFace 不同，CivitAI 站点更偏向于 UGC 一些，所以你会看到更多个人训练的模型，但是这并不意味着它们的质量会差，相反，你会发现有些模型的质量非常好。而且 CivitAI 比 HuggingFace 多了很多好用的功能，比如你可以通过筛选等方式，看到各种各样优秀的模型
Hugging Face：大型的模型资源网
吐司：国人的AI模型网站，里面的资源符合大多数国人审美
CGSociety：CG模型参考网站，海量的模型
A站：CG艺术分享网站，可以参考，垫图素材库
微元素：CG网站，可作三维绘图的参考

网站

Comflowy – ComfyUI 社区：探索 ComfyUI 的无限可能，致力于以 ComfyUI 和 Stable Diffusion 为核心，打造更优质的生产工具、构建开发者与用户内容社区。
Fooocus：专注于提示和生成
StableDiffusionBook：关于 Ai 绘画的Wiki
StartAI：是一款专为设计师打造的基于Photoshop的AI工具，轻松
提升你的设计效率，激发无限创意

X（Twitter）

@nickfloats：公开探索 AI 并分享学习成果，每日玩转 Midjourney 和 NeRFs
宝玉：Prompt Engineer，致力于学习和传播有关人工智能、软件工程和工程管理的知识。
归藏： AI 知识每周都发布在 AIGC Weekly 周刊，主要内容是上周 AI 领域的重点动态解析以及相关的产品和文章
DynamicWang：AW Portrait模型的作者，推特上经常分享制作流程

AI Copilot：由一名医学生维护的关于 AI 的非营利频道

语雀

飞书 / Lark（国际版飞书）

🌈通往 AGI 之路：要实现通用人工智能(AG)也许有很长的路要走，我们的目标是让每个人的学习过程少走弯路，让更多的人因 AI 而强大。

Bilibili

秋葉aaaki

Stable Diffusion

介绍

Stability AI 是全球领先的开源生成式人工智能公司，提供突破性的开放式人工智能模型。

官网 & 社媒
官网、X 、Discord、Youtube

第三方
Stable Diffusion Web UI Github
严格意义上来说是一个基于Stable Diffusion的开源项目。这个项目非常强大，把原本很难安装配置的开源项目做成了一个简单易操作的网页，后来又引入了插件系统，可以玩出很多花样。最重要的是这一切都免费且开源。

界面基础

了解UI界面

文生图 (txt2img)：根据文本提示生成图像

图生图 (img2img)：根据提供的图像作为范本、结合文本提示生成图像

更多 (Extras)：优化（清晰、扩展）图像

图片信息 (PNG Info)：显示图像基本信息,包含提示词和模型信息（除非信息被隐藏）

模型合并 (模型合并)：把已有的模型按不同比例进行合并生成新模型

训练 (Train)：根据提供的图片训练具有某种图像风格的模型

提示词 (Prompt)

提示词又称为咒语，分为两个类型：正面和负面。

正面提示词 (Prompt)
就是你希望出现在画面中的东西，描述的越详细，越能达到你想要的效果。

负面提示词 (Negative Prompt)
就是你不希望出现在画面中的东西。

💡加不加负面提示词，对于整个图片的品质有很大的影响

尺寸 & 生成数量

Width( 宽)、Height (高)并非越大越好，使用默认的512×512即可，因尺寸越大，对电脑的配置要求越高、生成的图片速度越慢。

生成批次 (Batch Count)：每次生成图像的批数，一次运行生成图像的数量为生成批次 * 每批数量
每批数量 (Batch Size)：同时生成多少个图像的意思，除 4090 等高级显卡以外通常保持为 1

采样步数 (Sampling Steps)

Stable Diffusion文生图的原理是通过从充满噪声(noise)的画布开始逐渐对其进行降噪处理，以达到最终输的图像效果。而采样步数这一参数就是用来控制去噪步骤数的。通常情况下该数值越高越好，但一般情况下我们使用的25的采样步数值就足以生成任何类型的图像了，而更多的采样步数产生的效果几乎很难看出差别，反而会浪费GPU资源。

以下为一些采样步数的使用技巧：

如果你在试验你的提示词，想快速产生新的图像来查看是不是你想要的效果，以便继续调整你的提示词输入，你可以将采样步数值设为10-15，因为在这个区间下的采样步数已经能够大致代表最终的效果了；
如果你试验时发现效果还不错，想得到你喜欢的提示词产生的最终效果图了，那你可以将采样步数调整到 25；
如果你生成一张写实的脸部或者动物毛发等这一类具有精细纹理、质感等的图片，并且你觉得25的采样步数下还是缺少一定的细节，那不妨将尝试将该参数值调整到40，可能会有更好的效果。

采样器 (Samplers)

简单来说，采样器是一种算法，在每一步之后获取生成的图像，并将其与文本提示要求的内容进行比较后进行一些更改，直到逐渐达到与文本描述相匹配的图像。

在SD上，我们最常用的采样器有dpm系列和euler系列，其中dpm系列会有更加接近真实世界的效果，euler系列会让真实感减弱同时更加富有艺术感。

采样器的采用没有具体的规则，需要根据自己想要的效果以及提示词的内容来进行选择。

CFG Scale (提示词相关性)

用来调整图像与提示词的相关性，该值越高，提示词对最终生成结果的影响越大，相关性越高，但它也在一定程度上降低了图像质量，可以用更多的采样步骤来抵消。过高的CFG Scale体现为粗犷的线条和过锐化的图像，越低的值产生越有创意的结果，比如3。但是如果太低，例如1，那提示词就完全没用了，我
一般在设置在7-12。

SD中该参数默认的值为7，它在提示词与创造力之间取得了一个均衡的效果，所以我们一般也不会去改变该数值。

通常不建议该值低于5，因为这样会使图片看起来更像是幻觉一样；该值如果过高而你的提示词又不够详细的话，就并不一定能让生成的图像贴合提示词了，高于6时就可能开始给图像带来很多难看的效果。

那么什么时候使用不同的CFG比例值呢？以下提供了几个范围参考，每个范围适用于不同的提示词和想要达成的图像效果。

CFG 2一6：图片很会有创意，但也可能非常扭曲奇怪。该范围下对于对于简短的提示可能很有趣并且很有用。
CFG 7一10：推荐用于大多数提示词。该范围下，创造力和提示词之间会有一个良好平衡。
CFG 10一15：当你非常清楚你希望最终生成的图像是什么样子，并且你的提示词对于你想要的图像有一个很详细的描述时，你可以选择该范围。
CFG 16一20：一般不推荐，除非你的提示词非常详细。否则可能会严重影响生成图片的质量。
CFG>20：该范围下几乎无法使用。

种子 (Seed)

在采样器中我们提到了噪声，而种子的数字就决定了图像生成的初始随机噪声，在我们的提示词完全相同的时候，生成的图像时常也会很大的差别，就是因为你选择不同的种子，或者将种子的值默认为了随机值(-1)。反之如果我们采用相同的提示词和种子时，会生成很类似的图像。