看见时间里的中国:用AI绘画工具绘制你的历史想象
简介
“中国是一个伟大的国度,传承着伟大的文明。” 这句话描绘的不仅仅是一段文字历史,更是一幅幅生动的视觉画卷。从巍峨的万里长城到雅致的宋代园林,从盛唐的市井繁华到丝绸之路上的驼铃声声,这些画面如何能从尘封的史籍中“跃然纸上”?在人工智能时代,我们有了全新的工具——AI绘画。本教程将带你一步步使用AI绘画工具,将你脑海中对历史中国的想象,转化为独一无二的视觉作品,真正地“看见”时间里的中国。
前置准备
在开始创作之前,你需要准备以下工具和环境:
- 一个AI绘画账号:推荐使用 Midjourney 或 Stable Diffusion。
- Midjourney:通过Discord使用,艺术风格强,擅长生成富有美感和细节的图像。对于历史场景的氛围渲染尤为出色。你可以在Discord官网注册账号,然后通过Midjourney官网链接进入其频道。
- Stable Diffusion:开源模型,可在本地部署,自由度极高。适合喜欢深度定制、技术探索的用户。部署需要一定的技术基础,但网上有大量整合包(如“A启动器”)可以简化过程。
- 基础工具:一台可以上网的电脑。如果打算本地运行Stable Diffusion,建议拥有一块显存6GB以上的NVIDIA显卡以获得流畅体验。
- 创作灵感:对某个中国历史时期或场景有基本的了解。可以是一段史书描写、一句古诗,或是一个简单的场景关键词。
分步教程:以Midjourney为例绘制“盛唐长安西市”
第一步:构思与关键词提炼
AI绘画的核心是“提示词”(Prompt)。你需要将脑海中的画面拆解成AI能理解的关键词。
- 主题:唐代都城长安的西市(当时世界性的商贸中心)。
- 风格:希望呈现写实历史画风格,而非卡通或二次元。
- 元素:胡商、骆驼、丝绸、瓷器、木质建筑、飘扬的旗幡、熙攘的人群。
- 氛围:繁华、热闹、暮色时分。
- 技术参数:宽幅画面、高质量、细节丰富。
将这些元素组合成一个基础的英文提示词(Midjourney主要理解英文):
A bustling scene of Chang'an West Market in the Tang Dynasty, with merchants from the Silk Road, camels, silk rolls, porcelain, wooden buildings, fluttering banners, crowds of people, at dusk, realistic historical painting style, panoramic view, high detail, intricate --ar 16:9 --v 6.0
提示:关键词越具体,生成的图像越符合预期。你可以使用翻译工具辅助,但尽量用直观的英文词组。
第二步:生成与迭代
- 在Midjourney的Discord频道中,选择一个
#newbies频道(新手频道)。 - 在输入框中输入
/imagine命令,然后粘贴你准备好的提示词,按回车发送。 - 等待约一分钟,机器人会生成四张基于你提示词的图像草稿。
- 初次结果分析与调整:生成的图像可能不完全符合想象。这可能是因为某些关键词权重不够,或者风格描述不准确。例如,如果人物看起来更像西方人,可以在提示词中强调
East Asian features(东亚人特征)。如果建筑风格不对,可以加入Tang Dynasty architecture(唐代建筑)等更明确的词条。
第三步:优化与放大
从四张草稿中选择你最喜欢的一张(例如第二张)。
* 点击 U2(Upscale for Image 2)按钮,AI会对这张图进行细节放大和优化,生成一张高清大图。
* 点击 V2(Variation for Image 2)按钮,AI会基于第二张图的构图和风格,生成四张新的变体,给你更多选择。
* 高级参数调整:你可以在提示词末尾添加更多参数,如 --style raw(更贴近原始提示,艺术化处理较少),或调整 --chaos(混沌值,0-100,数值越高,结果越多样意外)来探索更多可能。
第四步:后期处理与导出
生成满意的高清图后:
1. 点击图像,然后点击右下角的“在浏览器中打开”图标。
2. 在网页上右键点击图像,选择“图片另存为”即可保存到本地。
3. 你可以使用Photoshop或免费的图片编辑软件(如GIMP、Paint.NET)对图像进行简单的裁剪、调色或添加文字。
代码示例:用Python调用API实现自动化生成(进阶)
如果你熟悉编程,可以使用Stable Diffusion的WebUI API或调用云服务商的API,实现批量或参数化生成。以下是一个使用 requests 库调用虚构API的简单示例,展示了其基本逻辑:
import requests
import base64
from io import BytesIO
from PIL import Image
# API设置 (以Stable Diffusion WebUI API为例)
API_URL = "http://127.0.0.1:7860/sdapi/v1/txt2img"
# 历史场景提示词库
prompts = [
"Song Dynasty scholar studying in a serene bamboo study, ink wash painting style, masterpiece",
"Ming Dynasty porcelain artisan crafting a blue and white vase in a workshop, detailed realism",
"Han Dynasty terracotta warrior standing guard, dramatic lighting, cinematic"
]
headers = {"Content-Type": "application/json"}
def generate_history_image(prompt, filename):
payload = {
"prompt": prompt,
"negative_prompt": "modern, cartoon, low quality",
"steps": 30,
"width": 768,
"height": 512,
"sampler_name": "Euler a"
}
response = requests.post(API_URL, json=payload, headers=headers)
if response.status_code == 200:
r = response.json()
image_data = base64.b64decode(r['images'][0])
image = Image.open(BytesIO(image_data))
image.save(filename)
print(f"已保存图像:{filename}")
else:
print(f"生成失败,状态码:{response.status_code}")
# 批量生成示例
for i, prompt in enumerate(prompts):
generate_history_image(prompt, f"chinese_history_{i}.png")
这段代码展示了如何通过程序化方式,批量将不同的历史主题提示词转化为图像,是进行系统性视觉资料收集或创作的有趣起点。
相关工具推荐
除了主角Midjourney和Stable Diffusion,以下工具也能助你更好地“看见”历史:
- Adobe Firefly:Adobe推出的AI绘图工具,集成在其创意云软件中。其模型训练数据来源更合规,且对中文提示词的理解正在优化,适合专业设计工作流。 Adobe Creative Cloud 年费订阅
- NovelAI / Niji·Journey:如果你对绘制历史人物的肖像、服饰或插画风格感兴趣,这两个工具在特定领域(如动漫风格、人物一致性)表现突出。可以尝试生成精致的汉服人物或古典场景。
- Leonardo.AI:一个功能全面的在线AI图像生成和模型训练平台。它提供了许多预设的“模型”,其中可能包含专门针对古典艺术、中国风训练的模型,能极大简化提示词编写过程。
为了获得最佳的AI绘画体验,一台拥有出色屏幕显示效果和足够算力的设备至关重要。你可以考虑一台高性能的游戏笔记本电脑用于本地运行Stable Diffusion,或一台色彩准确的专业设计显示器来细细调整你的生成作品。
常见问题
Q1: 为什么AI生成的人物经常是“四不像”或者具有西方特征?
A: 这是因为许多基础模型的训练数据中西方图像占比更高。解决方法是:1) 在提示词中明确加入 Chinese man, woman,以及 Hanfu(汉服)、Tang Dynasty costume等服饰关键词;2) 使用针对亚洲人脸型进行过微调的专用模型(Checkpoint)。
Q2: 生成的建筑总是感觉“很怪”,不够写实怎么办?
A: 历史建筑对AI来说挑战巨大。可以尝试:1) 在提示词中参考真实建筑名称或风格,如 based on the architecture of the Forbidden City 或 Song Dynasty style wooden architecture;2) 使用图生图(img2img)功能,上传一张真实古建筑照片作为参考底图,再结合文字描述生成。
Q3: 生成的图像版权可以商用吗?
A: 需要谨慎。不同平台政策不同:
* Midjourney:付费用户生成的图像通常拥有商用版权。
* Stable Diffusion:使用开源模型(如SD1.5, SDXL)生成的图像版权归属尚有争议,但一般认为可用于非商业用途。若使用基于特定版权作品微调的模型,可能存在风险。
* Adobe Firefly:Adobe声明其训练数据来源已获授权,生成的图像可用于商业用途。
在进行任何商用前,务必详细阅读并遵守各平台的服务条款。一块可靠的移动硬盘可以帮助你妥善备份所有生成的原始文件和工程文件。
总结
通过AI绘画工具,我们获得了前所未有的能力,去可视化那些存在于文字和想象中的历史片段。从构思关键词到生成迭代,每一步都是在与AI进行一场跨越时空的协作。尽管目前的工具仍有局限,但它们正以惊人的速度进化。掌握这些工具,不仅能让历史爱好者直观地“看见”时间里的中国,更能为教育、设计、文创等领域带来全新的可能性。现在,就打开你选择的工具,从一个你感兴趣的朝代或场景开始,生成第一张属于你自己的“历史画卷”吧!这个过程本身,就是对“传承”二字的一次数字时代的全新诠释。