AI日报:类GPT-5新模型将上线?奥特曼发草莓照片引热议;美图发布美图云修Pro版; ComfyUI已支持腾讯混元DiT与Flux模型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、奥特曼发草莓图引发猜测暗示OpenAI将发布新模型 “Strawberry”
山姆・奥特曼在社交媒体发布关于夏季花园的照片,引发关于新模型 “草莓” 的猜测。网友热议草莓项目可能即将到来,期待其突破性质。
2、百度网盘发布AI修图摄影行业解决方案
百度网盘在2024年8月推出针对摄影行业的解决方案,集存储备份、AI修图和高效交付于一体,旨在帮助影楼提高效率、降低成本并增强业务增长。该解决方案通过一站式服务,实现了存储备份、内部协同、AI修图和一键交付,成功解决了影楼的管理、效率和成本问题。
3、美图发布美图云修Pro版 上线AI批量调色、AI批量精修等功能
美图公司旗下的美图云修Pro版引入了AI批量调色、AI批量精修等新功能,为商业摄影行业提供更全面的修图解决方案。AI工作流实现了从转档、修图到交付的自动化处理,显著提高工作效率。已有3万余家商业摄影机构选择使用美图云修,年修图量超过5亿张,精修效率提升12倍。
4、360AI企业浏览器升级 支持AI搜索、办公助手和AI应用商店
360企业安全浏览器是一款为企业提供综合安全办公解决方案的浏览器,具备智能办公和安全防护功能,支持灵活部署以满足不同企业需求。它提供AI办公助手、360AI搜索和文档、音视频分析等AI应用,构建高效办公环境,全面安全防护,聚合应用,实现智能化办公。通过跨平台兼容性支持多种操作系统,提供200条管控策略,为企业提供安全、高效、智能化的办公环境。
5、腾讯混元大模型:斩获“图生文”多模态理解国内大模型第一
腾讯混元大模型在8月SuperCLUE-V测评中荣获国内大模型排名第一,展现出在多模态理解领域的卓越表现。其综合优势得益于对图像识别精确度和现实世界理解力的深入考验。腾讯混元大模型技术底座支持AI原生应用腾讯元宝,已扩展至万亿级参数规模,具备国内领先水平的多模态理解能力。
6、Comfy Org重大进展:ComfyUI已支持腾讯混元DiT与Flux模型
Comfy Org 最近取得了重大进展,引入了新的模型支持和技术升级,加强了核心执行引擎,展现了对技术创新和用户体验的承诺。这些更新使得 ComfyUI 在 AI 领域变得更加可靠和强大。
7、Reddit用户实测:GTP-4o在国际象棋上击败Gemini1.5pro
在最近的实验中,Reddit用户@zefman搭建了一个平台,让不同的语言模型实时对战国际象棋,其中GPT-4o表现出色成为最强选手。实验展示了不同模型的思考过程,提供了有趣的互动体验。
8、全景图像生成新方法PanoFree:无需调优生成多视角图片
PanoFree是一种无需调优的多视角图像生成技术,通过迭代变形和修补解决了一致性和伪影问题,提升了时间效率和内存使用效率,结果多样性更高。
9、ExAvatar: 通过简短视频克隆人像并转化为3D数字形象
ExAvatar是由DGIST和Meta公司的Codec Avatars Lab联合研发的一项技术,能够通过捕捉视频中的动作和表情,转化为栩栩如生的3D数字形象。这项技术解决了以往技术中的难题,提高了动画的自然度和渲染效果。
10、Mistral AI推出新开发工具 用户可自主优化和构建智能Agents
Mistral AI最新推出的开发工具为用户和开发者提供了更强大、更灵活的AI模型优化和应用能力,受到广泛关注和期待。用户可以通过La Plateforme微调模型,使用Agents平台构建智能Agents,同时新版本SDK支持Python和Typescript,提供更多选择和灵活性。
11、Napkin:利用AI轻松将文本转化为可视化图形
在信息爆炸的时代,Napkin是一款利用AI技术的视觉化平台,能够将文本转化为各种可视化图形,帮助用户更轻松地表达创意和思想。尽管具有创新潜力,但也存在一些挑战和改进空间。
12、OpenAI ChatGPT应用收入创新高7月净收入2800万美元
OpenAI旗下ChatGPT移动应用在今年7月创下单月收入新高,净收入达2800万美元,主要得益于推出的GPT-4omni 模式。该模式带来了处理文本、语音和视频的新能力,提供更快的响应速度,使人工智能交互更加自然。尽管增速有所放缓,但整体保持健康增长态势,预计未来几个月收入将继续增长。