AI日报:文本转语音模型Fish Speech;Meta 3D Gen发布,1分钟快速构建3D模型;AI生成熊猫吃泡面视频刷屏抖音
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、可以媲美GPT-SoVITS的低显存开源文本转语音模型Fish Speech
Fish Speech是一款由fishaudio开发的全新文本转语音工具,支持中英日三种语言,语音处理接近人类水平,使用Flash-Attn算法处理大规模数据,提供高效、准确、稳定的TTS体验。
2、Meta 3D Gen发布,1分钟内快速实现从文本生成3D资产
最近研究人员发布了名为Meta3D Gen(3DGen)的全新技术,能够在不到一分钟内快速实现从文本生成3D资产,为用户带来高质量的纹理和材质体验。该技术集成了Meta3D AssetGen和Meta3D TextureGen,提供了高效的3D模型创建方式,比现有解决方案快三到十倍。
3、微软开源GraphRAG,构建知识图谱增强大模型的问答、推理等能力
微软最新开源的GraphRAG系统利用实体知识图谱增强大模型的搜索、问答、摘要、推理等能力,特别适用于处理大规模数据集。通过构建全局性的实体知识图谱,GraphRAG能够捕捉文本中复杂联系和交互,提高检索准确性和全面性。此外,GraphRAG对tokens需求低,节省开发成本。在综合测试中表现优异,是目前最佳的RAG方法之一。
4、微软推出设计工具 Designer:一句话生成个性化贺卡
微软最新推出的Microsoft Designer的"Greeting Cards"功能为用户带来前所未有的个性化贺卡制作体验,展示了AI技术在日常生活中的实际应用。
5、腾讯翻译智能体公司TRANSAGENTS上线
TRANSAGENTS是腾讯AI实验室开发的专门用于进行文学翻译的多智能体虚拟翻译出版公司,通过模拟真实翻译公司的虚拟角色合作模式,实现流畅高效的文学作品翻译。使用TRANSAGENTS进行文学翻译的成本比专业人类翻译员低80倍,且在领域特定知识需求下表现超越人类翻译。该平台展示了AI技术在文学翻译领域的潜力,为文学创作和传播提供新可能性。
6、Suno推出iOS客户端 支持语音生成音乐
Suno公司推出的iOS应用让手机变成虚拟音乐工作室,引领音乐制作革命,可能改变数字时代下创意表达方式。面临法律挑战,但坚称技术旨在生成全新作品。Suno的iOS应用代表AI生成音乐向大众迈出的重要一步,引领音乐界未来潮流。
7、苹果公司高管以观察员身份加入 OpenAI 董事会
我认为这篇文章报道了苹果公司高管 Phil Schiller 以观察员身份加入 OpenAI 董事会的消息。这将使苹果更了解 OpenAI 的内部运作,并有望在 iOS 和 macOS 中整合 ChatGPT,提升 Siri 的智能化水平。微软也加入了 OpenAI 董事会,使得合作关系更加复杂。
8、AI生成的熊猫吃泡面视频抖音获赞超42万 网友直呼太逼真
最近,抖音上的AI生成视频技术达到了新高度,熊猫和猫咪用筷子吃泡面的视频让人难以置信。虽有瑕疵,但未来AI视频将更逼真。
9、网友将GPT-4V接入家中摄像头 百万网友围观他做这事!
一位国外网友将GPT-4Vision接入家中摄像头,引发百万网友围观。这种行为展示了AI技术在日常生活中的潜力,但也引发了隐私和安全问题的讨论。随着技术发展,我们期待更多创新且安全的应用出现。
10、怒了!苏格兰艺术家“自毁”作品,抗议AI对艺术的负面影响
苏格兰艺术家迈克尔・福布斯以涂抹自己的艺术作品的方式,表达对人工智能(AI)对艺术领域的负面影响的抗议。福布斯已经在四幅画作上进行了 “编辑”,其中包括约翰・列侬和美国歌手泰勒・斯威夫特的作品。他希望通过自己的举动唤起对 AI 在艺术领域侵权行为的重视。艺术家们已经无法与计算机生成的图像竞争,导致许多人放弃了艺术家的职业。