✦
中文原生基因：彻底终结了开源模型不识中文的历史。无论是复杂的繁体字、竖排书法，还是电商大促的营销文案，准确率高达 90% 以上。
✦
商业级编辑能力：独创的 LongCat-Image-Edit 版本，支持高精度的局部重绘 (Inpaint)。换背景、换服装、改动作，人物 ID 保持不变。
✦
极低门槛：仅需 8GB 显存（RTX 3060）即可流畅运行。内置 Prompt 改写器，让小白也能用大白话生成大师级作品。

核心功能深度解析

四大核心能力，为中文创作者量身打造

🇨🇳

中文文本渲染天花板

彻底解决 Flux、SD3、Midjourney 等模型的中文乱码问题

•双语字形编码，覆盖 99% 常用中文字典
•横排、竖排、艺术字体，字符笔画 100% 正确
•全球首个支持同画面中英混排的模型

✨

智能提示词改写器

告别复杂的 Prompt 魔法咒语，大白话直出大师级作品

•原生集成轻量级 LLM 文本优化模块
•输入漂亮女孩在雪地，自动优化为专业 Prompt
•新手出图成功率从 30% 提升至 95%

🖌️

商业级图像编辑

LongCat-Image-Edit 版本，专注高精度局部重绘

•ID 保持：换装换背景，面部特征完全不变
•光影自适应，编辑区域无缝衔接
•自然语言指令：把背景换成故宫红墙

⚡

极致性能表现

6B 参数达成 20B MoE 模型的画面细节

•RTX 4090: <2秒/图
•RTX 3060 (8GB): 约 5 秒
•支持 INT8 量化进一步降显存

技术架构

深入了解 LongCat-Image 的技术实现

基础架构

DiT + Flow Matching

先进的扩散 Transformer 架构

参数规模

轻量但强大的模型规模

采样器

ODE Solver

高效的采样算法

默认步数

30 步

快速生成高质量图像

文本编码器

T5-XXL + CLIP

双编码器理解复杂语义

VAE

自研高保真 VAE

细节还原能力更强

三种方式快速上手

根据你的需求选择最适合的使用方式

在线体验（零门槛）

无需安装任何环境，直接在浏览器中体验

🤗 HuggingFace Space 🚀 ModelScope 体验

Python 本地部署

适合开发者和需要批量处理的用户

pip install diffusers transformers accelerate

from diffusers import LongCatPipeline
import torch

pipe = LongCatPipeline.from_pretrained(
    "meituan-longcat/LongCat-Image",
    torch_dtype=torch.bfloat16
).to("cuda")

image = pipe("一只橘猫坐在中秋月饼旁边，旁边写着'中秋快乐'").images[0]
image.save("output.png")