type
status
date
slug
summary
tags
category
icon
password
为什么要写这篇文章
方便快速查询感兴趣AI技术或者项目
记录
阿里开源 OmniAvatar:音频驱动数字人模型
OmniAvatar 是阿里开源的一款基于 Wan 2.1 的音频驱动数字人模型。用户只需上传图片、音频和脚本,即可生成嘴型精准匹配、带有自然动作和表情的口播视频。
不过要注意的是,这个模型至少需要 36G 显存才能运行。
腾讯开源数字人Sonic
腾讯和浙大合作的数字人技术:Sonic。
可以用一张照片+一段视频,生成可以动的数字人。
Sonic
jixiaozhong • Updated Aug 10, 2025
使用 Zenfeed 将文章转换为播客
Zenfeed 的播客功能可以将任何文章源自动转换为一场引人入胜的多人对话式播客。该功能利用大语言模型(LLM)生成对话脚本和文本转语音(TTS),并将最终的音频文件托管在您自己的对象存储中。
demo: Zenfeed
podcast.md
glidea
AI Novel Editor基于PyQt6的AI辅助小说编辑器
基于PyQt6的AI辅助小说编辑器,提供智能补全、项目管理、概念组织等专业写作工具。
Ai-Novel-Editor
inliver233 • Updated Aug 3, 2025
MoneyPrinter V2一个自动化在线赚钱过程的应用程序
分支:只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。
MoneyPrinterTurbo
harry0703 • Updated Aug 10, 2025
AI 开源P图工具
OmniGen2 是一个基于 AI 的P图全能选手,它不仅会画图,看图、改图、拼图样样行,网页点开就能玩,显卡差点也能跑。
OmniGen2
VectorSpaceLab • Updated Aug 11, 2025
读图:你丢给它一张图,它能看懂里面有什么东西、在干啥。
画图:你输入一句描述,比如“一只戴墨镜的羊驼站在太空飞船上”,它就能给你画出来!风格还挺潮。
P图:上传一张图,告诉它怎么改,“把照片里那件黄裙子改成蓝色色!”,“照片里面的人挥下手!”。
它就能按你的意思P出新图,效果在开源模型里数一数二。
Loading...