AI日报:美团推虚拟人视频生成模型;QQ音乐推本地化AI作曲;GPT-5.2-Codex 正式亮相
更新时间:2025-12-20 02:27 浏览量:2
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
1、Google Gemini 应用重磅更新:用户可轻松检测视频是否由 Google AI 生成
Google 推出 Gemini 应用新功能,用户可上传视频并检测其是否由 Google AI 生成,提升 AI 内容透明度和可信度。
【AiBase提要:】
🎥 SynthID 水印检测全面升级,可识别视频中 AI 生成内容。
🔍 用户可通过 Gemini 应用上传视频并查询是否由 Google AI 生成。
🌐 功能覆盖全球,无需额外订阅或工具。
详情链接:https://blog.google/technology/ai/verify-google-ai-videos-gemini-app/
2、GPT-5.2-Codex 正式亮相:以“上下文压缩”攻克长程编码难题
GPT-5.2-Codex 的发布标志着智能代编码领域的重大突破,其在代码重构、系统迁移以及网络安全防御方面表现出卓越性能,同时通过严格的访问控制策略保障技术安全。
【AiBase提要:】
🧠 GPT-5.2-Codex 通过上下文压缩技术提升长程任务执行能力。
🛡️ 在网络安全领域展现出专业级的夺旗赛(CTF)实战水平。
🔒 采取多层次部署策略,确保技术普惠与安全合规并重。
3、美团推出 SOTA 级虚拟人视频生成模型 LongCat-Video-Avatar
美团LongCat团队推出SOTA级虚拟人视频生成模型LongCat-Video-Avatar,该模型在长视频生成领域表现优异,具有多项核心功能,吸引了广泛开发者关注。
【AiBase提要:】
🎥 LongCat-Video-Avatar 是美团LongCat团队推出的视频生成模型,支持多任务功能。
🧠 采用Cross-Chunk Latent Stitching训练策略,提升长视频生成质量。
📊 在多个数据集上达到SOTA水平,展现强大应用潜力。
详情链接:https://github.com/meituan-longcat/LongCat-Video
4、苹果发布全新多模态 AI 模型 UniGen 1.5,实现图像理解、生成与编辑三合一
苹果最新推出的多模态AI模型UniGen1.5在图像处理领域实现了重要突破,其集成图像理解、生成和编辑功能,显著提升了工作效率。通过“编辑指令对齐”技术,模型能够更准确地捕捉用户意图,提高图像编辑的准确性。在多项行业标准测试中,UniGen1.5表现出色,展现了强大的竞争力。
【AiBase提要:】
🧠 UniGen1.5集成了图像理解、生成和编辑功能,提升了工作效率。
🛠️ 引入“编辑指令对齐”技术,提高了图像编辑的准确性。
📊 在多项测试中表现优异,显示出强大的竞争力。
详情链接:https://arxiv.org/abs/2511.14760
5、ElevenLabs打通WhatsApp!AI语音助理可接打电话、批量外呼,客服革命正式落地
ElevenLabs在2025年12月18日宣布其AI语音智能体(Agents)深度集成WhatsApp,实现了文字+语音双模全渠道交互。这一更新不仅提升了企业的客服效率,还降低了部署成本,显著提高了客户满意度和转化效率。
【AiBase提要:】
✅ 自然接听来电:用户拨打企业WhatsApp号码,AI即以高度拟人化语音应答
✅ 主动外呼服务:支持单次或批量外呼,适用于预约提醒、催收通知、客户回访等高频场景
✅ 实时语音交互:无论用户发送语音消息,还是AI主动拨打电话,均实现低延迟、高自然度的流畅对话
详情链接:https://elevenlabs.io/docs/agents-platform/whatsapp
6、字节跳动 AI 手机合作方案曝光,免收 Token 分成开启“让利换入口”
字节跳动正积极与多家头部硬件厂商展开 AI 手机合作,通过预装 AIGC 插件获取 AI 流量入口,并提供让利策略吸引厂商参与,以提升自身在 AI 领域的竞争力。
📱 字节跳动与 vivo、联想、传音等厂商合作,预装 AIGC 插件以获取 AI 流量入口。
💰 采用免收定制开发费与 Token 销售分成的策略,吸引手机厂商参与流量分发和收益分成。
🤝 此次合作旨在打破手机厂商对第三方 AI 的戒备,提升 AI 竞争力。
7、Claude AI 新 “任务模式” 上线:智能助手全新进化,能提问会执行!
Claude AI 的新任务模式通过创新的双面板设计、结构化行动计划以及自动化技能集成,显著提升了智能助手在复杂任务中的表现和用户体验。
【AiBase提要:】
🧠 Claude 任务模式引入双面板布局,提升任务执行效率。
📝 支持生成结构化行动计划和澄清性提问,确保任务准确性。
🛠️ 集成多种技能和模型上下文协议,实现自动化任务处理。
8、Luma发布Ray3 Modify:AI视频编辑新突破,保留演员表演细节,一键换装、换场景
Luma AI发布Ray3Modify,实现了对实拍视频的高保真AI修改,保留演员表演细节的同时支持换装、换场景,为影视、广告、游戏等行业带来新的创作可能性。
【AiBase提要:】
🎬 通过角色参考图和关键帧实现精准编辑
🔄 保留演员表演细节,支持换装、换场景
💰 获得9亿美元融资,计划建设AI算力集群
9、QQ音乐推本地化AI作曲:酷睿Ultra加持,几分钟生成完整歌曲,创作隐私不外泄
QQ音乐推出的本地化AI作曲功能,通过酷睿Ultra处理器实现完全本地化的大模型音乐生成,极大降低了创作门槛并保障了隐私安全。
【AiBase提要:】
🎧 QQ音乐推出本地化AI作曲功能,用户无需联网即可创作原创歌曲。
🔒 采用本地推理路径,保障创作隐私,数据不上传服务器。
🧠 酷睿Ultra处理器内置NPU,提升AI计算效率并延长电池续航。
10、微信元宝 AI 助手增加新功能,轻松一句话设置提醒
微信元宝 AI 助手新增了通过一句话设置提醒的功能,让用户能够更便捷地管理日程和待办事项。同时,它还具备解析公众号文章、图片及文档内容的能力,并支持语音交互,降低了使用门槛,适合各类用户群体。
【AiBase提要:】
📅 元宝 AI 助手支持用户通过一句话轻松设置提醒,提升了日程管理的便捷性。
🗣️ 用户可以通过语音消息与元宝互动,方便长辈用户使用。
📱 元宝不仅限于提醒功能,还提供文章解析、图文识别等多种实用功能。
