-
Notifications
You must be signed in to change notification settings - Fork 29
Description
AnimeGamer 团队和社区的朋友们,大家好!
我注意到 AnimeGamer 这个非常有意思的项目刚刚开源,并制作了一个 YouTube 视频,记录了在本地(Windows 10 下的 WSL Ubuntu 环境)尝试部署和运行它的完整过程,希望能为其他感兴趣的同学提供一个参考,同时也分享一些我在部署和使用中遇到的情况和初步反馈。
视频链接在这里: [https://youtu.be/jb0eO2FJT6A]
视频主要内容包括:
(00:10) 项目介绍:AnimeGamer 的目标(通过提示词将动漫角色放入场景)。
(01:01) 浏览 GitHub 和 Hugging Face 页面,了解项目现状和提供的模型(目前两个角色)。
(02:40) 模型需求: 需要下载角色模型、多模态模型和视频生成模型,文件较大,建议提前准备。
(03:49) 重要环境配置 - WSL RAM 调整:
我的系统内存 64GB,默认 WSL 分配 32GB 不足以完成推理(会在第一步运行中终止)。
视频演示了如何通过修改用户目录下的 .wslconfig 文件将 WSL 内存分配提高到 48GB 才得以成功运行。
(04:56) 重要部署提示 - 使用社区修复版本:
指出项目刚开源(当时仅 4 天),官方的安装指南和代码存在一些问题,直接按官方步骤无法成功运行。
提到了 GitHub Issue 中已有用户发现了问题并提供了修复。
本次视频演示使用的是社区用户修复后的 fork 版本 ([视频中 05:49 处提到的克隆地址]) 才成功部署。(期待官方后续能合并修复)
(06:27) 详细安装步骤 (基于修复版):
安装系统编译工具 (build-essential)。
手动安装 CUDA Toolkit (下载、安装、配置环境变量)。
克隆修复后的项目代码。
创建并激活 Conda 环境。
使用修复版的 requirements.txt 安装依赖。
(10:01) 拷贝预先下载好的模型文件到项目目录。
(10:56) 准备推理用的 prompts.txt 文件(视频中为了演示效率,减少了生成数量至 4 个)。
(11:56) 执行推理: 运行两个主要的推理命令。再次观察到 内存使用率非常高 (接近 48GB)。
(13:36) 结果展示与分析:
播放生成的 4 个视频,并对照 prompts.txt 进行分析。
观察到的现象:
部分视频能生成角色和背景,但动作/姿态可能有些 "奇怪"。
部分视频背景符合提示词,但运镜/视角 "不太准确"。
部分视频甚至 未能生成提示词中指定的人物,只有背景。
结论:当前阶段的生成效果与提示词描述存在一定差距,效果尚不稳定。
总结反馈要点:
文档与代码初期问题: 官方初始版本安装指南和代码存在问题,需要依赖社区修复才能跑通(期待官方更新)。
高内存需求: 运行推理需要远超 32GB 的内存,WSL 用户需要手动配置 .wslconfig 提高内存分配,建议在文档中明确指出内存需求。
生成效果: 目前的推理效果尚不稳定,存在动作/视角不准确、甚至缺失元素(如人物)的情况。
项目潜力: 尽管处于早期,但项目概念新颖,值得关注和期待后续发展。
希望这个详细的部署过程记录和初步的使用反馈能对项目的发展和其他用户有所帮助。这是一个非常有潜力的项目,感谢团队的开源分享!