AI日报记录 | 小九博客

type

status

date

slug

summary

为什么要写这篇文章

方便快速查询感兴趣AI技术或者项目

记录

阿里开源 OmniAvatar：音频驱动数字人模型

OmniAvatar 是阿里开源的一款基于 Wan 2.1 的音频驱动数字人模型。用户只需上传图片、音频和脚本，即可生成嘴型精准匹配、带有自然动作和表情的口播视频。

不过要注意的是，这个模型至少需要 36G 显存才能运行。

腾讯开源数字人Sonic

腾讯和浙大合作的数字人技术：Sonic。

可以用一张照片+一段视频，生成可以动的数字人。

Sonic

jixiaozhong • Updated Aug 10, 2025

使用 Zenfeed 将文章转换为播客

Zenfeed 的播客功能可以将任何文章源自动转换为一场引人入胜的多人对话式播客。该功能利用大语言模型（LLM）生成对话脚本和文本转语音（TTS），并将最终的音频文件托管在您自己的对象存储中。

demo: Zenfeed

podcast.md

glidea

AI Novel Editor基于PyQt6的AI辅助小说编辑器

基于PyQt6的AI辅助小说编辑器，提供智能补全、项目管理、概念组织等专业写作工具。

Ai-Novel-Editor

inliver233 • Updated Aug 3, 2025

MoneyPrinter V2一个自动化在线赚钱过程的应用程序

分支：只需提供一个视频主题或 关键词 ，就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐，然后合成一个高清的短视频。

MoneyPrinterTurbo

harry0703 • Updated Aug 10, 2025

AI 开源P图工具

OmniGen2 是一个基于 AI 的P图全能选手，它不仅会画图，看图、改图、拼图样样行，网页点开就能玩，显卡差点也能跑。

OmniGen2

VectorSpaceLab • Updated Aug 11, 2025

读图：你丢给它一张图，它能看懂里面有什么东西、在干啥。

画图：你输入一句描述，比如“一只戴墨镜的羊驼站在太空飞船上”，它就能给你画出来！风格还挺潮。

P图：上传一张图，告诉它怎么改，“把照片里那件黄裙子改成蓝色色！”，“照片里面的人挥下手！”。

它就能按你的意思P出新图，效果在开源模型里数一数二。

🤖AI日报记录

为什么要写这篇文章

记录

阿里开源 OmniAvatar：音频驱动数字人模型

腾讯开源数字人Sonic

使用 Zenfeed 将文章转换为播客

AI Novel Editor基于PyQt6的AI辅助小说编辑器

MoneyPrinter V2一个自动化在线赚钱过程的应用程序

AI 开源P图工具

Relate Posts

🥴情感备忘录

📖人工智能介绍

📖AI 时代普通人学习路线图

🧳香港旅游攻略

🛠️目前在使用的工具

🛠️YuMail免费无限邮箱