- TypeScript 46.2%
- Python 37.8%
- CSS 7%
- JavaScript 6%
- HTML 2.2%
- Other 0.8%
评审便利:demo 环境(烧入 203 API_URL 的镜像)登录页显示「一键体验·管理员登录」, 用 README 已公开的 demo 管理员账号直登。真生产(124,API_URL 空)不渲染此按钮。 Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com> |
||
|---|---|---|
| .github/workflows | ||
| apps | ||
| claude-design | ||
| data/cases | ||
| docs | ||
| examples | ||
| packages | ||
| scripts | ||
| seed-assets | ||
| tests | ||
| .dockerignore | ||
| .env.production.example | ||
| .gitignore | ||
| DEPLOY.md | ||
| deploy.sh | ||
| docker-compose.prod.yml | ||
| docker-compose.yml | ||
| Dockerfile.backend | ||
| Dockerfile.web | ||
| LICENSE | ||
| PROPOSAL.md | ||
| pytest 2.ini | ||
| pytest.ini | ||
| README.md | ||
| TODO.md | ||
万象 wanxiang · 电商 AI 创意工作流
心想 · 象成 — 商品图进,带评分的电商主图 + 多平台营销文案出。 面向中国电商与跨境商家的 AI Creative Studio:多模型智能路由省成本,VLM 三维评分给证据,6 品类专家规则保专业。
🔗 在线 Demo: http://203.205.88.27:8000 · 体验账号 admin@wanxiang.cn / lingangopc123(已充 888 credits;余额用完联系作者补充)
这个项目强在哪(30 秒版)
| 差异化 | 是什么 | 在哪验证 |
|---|---|---|
| 多模型智能路由 | 9 条规则在 9 个图像模型(GPT-Image-2 / Seedream / Flux / Gemini)间自动选型:中文文字场景走 Seedream,多对象 SKU 走 Gemini,英文排版走 Flux Flex…相比全程锁定旗舰模型,典型负载省约 50%,验证型负载最高 86%(完整算式) | packages/image_adapters/router.py + docs/ROUTING.md |
| VLM 三维评分 + 改进建议 | 每张出图自动打 CTR / Brand / Clarity 三维分(0-100),并给一条可执行的改进建议("商品占比偏小,建议提至 60%")。分数定义与局限见 docs/SCORING.md — 我们不把 VLM 预估分冒充真实投放 CTR | packages/scoring/vlm_scorer.py + docs/SCORING.md |
| 6 品类专家规则 | 美妆/食品/饮品/服饰/数码/家居各一组"必带元素/必避禁忌/推荐光影"规则注入 prompt 编译,来源是 AI 从 50 个精选模板聚类提取 + 人工复核 | packages/creative_core/industry_specialists/ |
端到端产出长什么样? 直接看 examples/ — 同一商品在小红书 vs Instagram 的不同文案与配图、"翻译 vs 本地化"对照、一个 creative job 的 7 阶段全程 trace。
Quick Start(本地跑起来)
依赖:Docker、Python 3.11、Node 18+。
# 1. 起基础设施(Postgres 16 + pgvector / Redis 7)
docker compose up -d
# 2. 后端依赖 + 数据库迁移
pip install -r apps/api/requirements.txt
cp .env.production.example .env # 按需改 DATABASE_URL/REDIS_URL/模型 API key
alembic upgrade head
# 3. 三个进程(各开一个终端)
uvicorn main:app --port 5010 --app-dir apps/api # API
arq apps.worker.main.WorkerSettings # Worker(出图流水线)
cd apps/web && npm install && npm run dev # Web → http://localhost:3000
生产环境一键部署(Docker 全栈 + nginx 反代)见 DEPLOY.md,或直接 ./deploy.sh。
API 文档(Swagger)
API 跑起来后,交互式文档在:
- Swagger UI: http://localhost:5010/docs
- ReDoc: http://localhost:5010/redoc
- 健康检查:
GET /health(存活)/GET /health/ready(DB+Redis 连通)
外部依赖说明
出图/评分/文案需要真实模型 API key(在 admin 后台 /admin/models 配置,支持 apiyi 聚合渠道 + DeepSeek/OpenAI)。没有 key 也能验证什么? WX_MOCK_AI=1 可零外部调用跑通完整流水线,见 docs/VERIFICATION.md 的离线验证路径。
功能矩阵
创作主链路(7 阶段状态机)
商品图 + brief → AI 解析 → 3 个创意策略(用户选)→ 高转化 Prompt 编译(品类专家规则 + RAG 模板检索 + 品牌约束注入)→ 多模型路由出图 → VLM 三维评分 + 改进建议 → 反馈闭环。
- Fast Lane 极速模式: 跳过策略选择与 prompt 审阅直出 — v31 实测 88.4s,v33 RAG 检索优化后 45.7s(计时证据见 examples/03)
- 场景预设: 双十一 / 新品上架 / 清仓 / 礼盒 / 白底 / 直播切片 / 跨境 / 批发,一键预填 brief
- 画面风格(v31/v34): 智能 / 棚拍静物 / 生活场景 / 使用瞬间 / 社媒种草感 / Amazon 主图(纯白底+占比 85%+无文字的硬约束出图,配套合规预检) — 非棚拍风格强制注入「人、动作、场景、情绪」
- 评分一键执行(v33): AI 总监建议直接变按钮 — 摆拍感强→一键场景化重画 / 光线暗→一键补光 / 背景乱→直达换背景
- 批量 SKU: 共享 brief + N 个 SKU 一次出 N 组图
工具链(基于已出图的二次加工)
| 工具 | 说明 | 成本 |
|---|---|---|
| 换背景 | 8 种场景 preset + 自定义 + 实拍背景上传,商品保留 | ~5c/张 |
| 抠图 | 透明 PNG,Gemini edit + PIL color-key | ~4.5c |
| 局部编辑 | 手动框选 bbox + 指令,Crop-Edit-Composite | 按模型 |
| 一键多尺寸 | banner / 详情头图 / 视频封面等 5 规格 | 免费 |
| 水印/文案叠加 | 5 种 preset(价格角标/促销横条等) | 免费 |
| 变体生成 | 同 prompt 不同 seed 再来 N 张 | 按模型 |
| Amazon 合规预检(v34) | 5 项主图硬规则逐项 pass/fail(纯白底/占比≥85%/无文字道具等)+ 修复建议 | ~0.3c |
营销文案(跨境双语)
10 个平台(小红书/抖音/天猫/京东/朋友圈/微博/Instagram/TikTok/Amazon Listing/Meta 广告)× 6 种风格(种草/国潮/极简/促销/生活方式/搞笑梗)× 3 档长度,VLM 看图生成 1-3 版本;中文可编辑后一键翻译成英文 — 本地化而非直译。每条文案自动过广告法合规检查(极限词/医疗宣称/夸大承诺,命中给改写建议)。
公开层
- 模板社区
/explore: 发布作品为模板(封面 VLM 综合分 ≥75 准入门槛),按「评分×真实使用热度」综合排序,fork 复用,双语标题(机制详见 docs/COMMUNITY.md) - 主图诊断器
/diagnose: 免登录上传主图 → 三维评分 + 改进建议(获客入口)
架构
flowchart LR
subgraph 前端
WEB[Next.js 14<br/>App Router]
end
subgraph 后端
API[FastAPI<br/>:5010]
WK[arq Worker<br/>7-phase 状态机]
end
subgraph 基础设施
PG[(Postgres 16<br/>+ pgvector)]
RD[(Redis 7<br/>队列 + SSE pub/sub)]
end
subgraph AI
LLM[LLM<br/>brief/策略/编译/文案]
IMG[图像模型 ×9<br/>智能路由]
VLM[VLM 评分<br/>CTR/Brand/Clarity]
end
WEB -->|REST + SSE| API
API -->|enqueue| RD --> WK
API & WK --> PG
WK --> LLM & IMG & VLM
7 阶段: BRIEF → STRATEGY →(用户选)→ COMPILE →(用户审)→ IMAGE → SCORING → COMPLETED,每阶段独立可重跑,SSE 实时推进度。完整 trace 见 examples/04。
仓库结构
apps/
api/ FastAPI 路由层(jobs / 工具链 / 模板 / 计费 / admin)
worker/ arq worker · creative_job 7-phase 流水线
web/ Next.js 前端(create 工作台 / explore / workspace / admin)
packages/
creative_core/ brief 解析 / 策略 / prompt 编译器 / 品类专家 / RAG 检索
image_adapters/ 9 模型统一 adapter + 智能路由 + 价格表
scoring/ VLM 三维评分
shared/ DB models / 计费 / 文案生成 / 图像工具服务
seed-assets/ 模板种子 SQL + 样图
examples/ 端到端真实产出样本(评审从这里看)
docs/ SCORING / ROUTING / COMMUNITY / VERIFICATION
tests/ pytest 单测(路由规则 / 计费 / 图像合成)
测试
pytest tests/ # 156 个用例:路由 fallback 链 / credit 计价 / 图像合成 / 合规 / mock / 全链路集成 / 文档一致性
cd apps/web && npx tsc --noEmit && npx eslint . # 前端 0 error / 0 warning
文档索引
| 文档 | 内容 |
|---|---|
| examples/ | 端到端真实产出样本(多平台对照 / 翻译 vs 本地化 / job trace) |
| docs/VERIFICATION.md | 评测复核入口:验证哪条 workflow、依赖清单、离线路径 |
| docs/SCORING.md | "高转化"评分的定义、rubric、A/B 证据与局限 |
| docs/ROUTING.md | 9 条路由规则 + 成本节省的完整算式 |
| docs/COMMUNITY.md | 模板社区:已实现机制 + 准入/回流/版权设计 |
| PROPOSAL.md | 完整产品提案(场景 / 逻辑 / 评测标准 / 竞品对标) |
| DEPLOY.md | 生产部署手册(Docker + nginx + 运维) |
| TODO.md | 路线图 |
免责声明与合规
- AI 生成的图片与文案仅供参考,正式投放前请人工二审,确保符合目标平台广告规范与当地法规(广告法 / FTC / 欧盟消费者保护等)。
- 评分体系中的 "CTR" 为 VLM 视觉预估分,不等于真实投放点击率,定义与局限见 docs/SCORING.md。
- 用户上传的商品图版权归上传者所有;发布到模板社区的内容授权规则见 docs/COMMUNITY.md。



