AI

阿里云推出视频生成大模型,一张图片可生成高清视频!

近日,阿里云推出全新视频生成大模型 I2VGen-XL,并在魔搭社区开放体验,用户上传一张图片后 2 分钟左右即可生成一段 1280*720 的高分辨率视频。据介绍,该模型的训练还使用了多种风格的视频数据,可生成科技感、电影色、卡通风格和素描等类型丰富的视频。

苹果低调发布开源多模态大语言模型 Ferret

苹果公司悄然发布开源多模态LLM模型Ferret,引起人工智能社区关注2023年10月,苹果公司与哥伦比亚大学的研究人员合作,低调推出了名为Ferret(雪貂)的开源多模态LLM(大型语言模型)。

苹果欲将大模型装进iPhone,明年或成AI手机关键元年

苹果日前发表题为《LLM in a flash:Efficient Large Language Model Inference with Limited Memory》的论文,苹果的人工智能研究人员表示,他们已取得一项重大突破,通过一种创新的闪存利用技术,成功地在内存有限的苹果设备上部署了大型语言模型(LLM)。这一成果有望让更强大的 Siri、实时语言翻译以及融入摄影和增强现实的尖端 AI 功

Midjourney v6 Alpha版本公测,细节拉满!

Midjourney团队昨天正式发布了Alpha版的Midjourney V6,Midjourney V6的开发是一项耗时久长的工程,团队在过去的9个月中致力于从零开始训练这个全新的模型。据官方介绍,V6模型相比之前发布的任何模型都能够生成更加真实的图像,而且不仅局限于此

【视频】特斯拉Optimus第二代机器人将于本月发布

特斯拉首席执行官埃隆·马斯克发布了最新一代人形机器人Optimus-Gen 2的演示视频。第二代Optimus预计将于2023年12月正式发布。视频中展示了机器人执行各种复杂动作,包括单腿支撑、瑜伽动作、蹲起、奔跑等。

Google 推出其最先进的文生图大模型 Imagen 2

最近,Google 推出了最新一代先进的图像生成模型 Imagen 2,它能够生成高质量、逼真的图像,与用户提供的提示词紧密结合,输出内容一致。Google 宣称,相较于第一代 Imagen,新模型在图像质量方面取得了显著提升,并且引入了一系列新功能,包括渲染文本和 LOGO 的能力。

Google 发布生成式 AI 模型 Gemini

谷歌于美东时间12月6日发布了全新一代大语言模型(LLM)Gemini,被誉为迄今为止谷歌最大、最全能的AI模型。与其他竞品不同的是,Gemini强调其灵活性,通过不同大小的版本适用于各种生成式AI应用。

微软正式发布 Copilot 正式版!

进入12月份,微软正式发布了Copilot,这款人工智能助手经过数月的预览后,终于迎来了正式版。Copilot的目标是为用户提供由人工智能驱动的网络聊天体验,并且已经具备了商业数据保护功能,完全兼容微软现有的商业服务。