目录
AI-Media2Doc
GitHub地址:https://github.com/hanshuaikang/AI-Media2Doc
AI-Media2Doc是一款基于 AI 大模型的开源 Web 工具,能够一键将视频和音频内容转化为多种文档风格,包括小红书推文、微信公众号文章、知识笔记、思维导图和视频字幕等,无需登录注册即可使用,并支持前端 ffmpeg wasm 处理、Docker 一键部署及自定义 Prompt 等功能,同时保障隐私安全与本地部署体验,极大降低 AI 内容创作门槛。
AI-Media2Doc核心亮点
- ✅ 完全开源:MIT 协议授权,支持本地部署。
- 🔒 隐私保护:无需登录注册,任务记录保存在本地
- 💻 前端处理:采用 ffmpeg wasm 技术,无需本地安装 ffmpeg
- 🎯 多种风格支持:支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。
- 🤖 AI 对话:支持针对视频内容进行 AI 二次问答。
- 🎬 支持字幕导出: 结果一键导出为字幕文件。
- 🖼️ 智能截图: 基于字幕信息智能截图并插入文章, 无需视觉大模型, 实现真正的图文并茂。
- 🎨 支持自定义 Prompt:支持在前端自定义配置 prompt。
- 🐳 一键部署:支持 Docker 一键部署。
- 🔒 支持设置访问密码: 后端设置访问密码之后, 前端用户需要填写该密码才可以正常使用。
项目截图
全新设计的首页, 尽力之作
更加简洁的加载页
全新功能: 支持智能截图并插入到文中对应位置(本地方案, 无需视觉大模型, 0成本)
开启方式, 点击自定义设置->智能截图 选择打开。
全新设计的结果页, 支持一键导出为字幕。
支持自定义 prompt
可基于视频内容进行 AI 二次对话
Deep-Live-Cam
地址:https://github.com/hacksider/Deep-Live-Cam
Deep-Live-Cam是一款基于深度学习的开源实时人脸替换工具,只需提供单张源人脸图片即可在直播或视频中生成逼真换脸效果,实现高精度、低延迟的换脸效果,降低创作与演示门槛。它集成了一键视频深度伪造(deepfake)功能,并在伦理合规方面设有多重防滥用机制,适用于直播、视频制作、游戏等多种场景。
实时换脸效果流畅
即使用户在做鬼脸、挑眉、摇头或快速移动,换脸效果依旧自然。依托 GPU 加速技术,画面无延迟、无崩坏,观感稳定流畅。

多平台支持与加速
Deep‑Live‑Cam 支持多种硬件环境,如 CPU、NVIDIA CUDA GPU、AMD、Apple Silicon、DirectML 和 OpenVINO,用户可根据设备环境享受实时性能优化。
oba-live-tool
地址:https://github.com/qiutongxue/oba-live-tool/releases
➡️ 支持平台:#Windows #macOS
一个直播带货工具,支持多个平台,包括抖音小店、巨量百应、抖音团购、小红书、视频号、快手小店和淘宝。
主要功能包括多账号管理、智能消息助手、商品自动讲解、AI自动回复和AI智能助理。
📸 界面预览












