GoogleBard最终允许您创建AI生成的图像例如ChatGPT和Bing
谷歌Bard已经推出并试图与微软的Bing和OpenAI的ChatGPT竞争一段时间了,但谷歌的AI聊天助手一直缺少其他AI聊天助手已经拥有的一个关键功能:图像生成。
值得庆幸的是,这种力量不平衡的情况即将结束。谷歌在博客文章中宣布了Bard的最新更新,除了推出更多语言版本的GeminiPro之外,还首次支持创建人工智能生成的图像。
Bard今天最值得注意的更新是能够通过文本提示生成图像。该功能目前仅提供英文版本,旨在“平衡质量和速度,提供高质量、逼真的输出。只需输入描述(例如“创建一只狗骑着冲浪板的图像”),Bard就会生成定制的、范围广泛的视觉效果,帮助您将想法变为现实。”
为了获得额外的创意提升,您现在可以在世界上大多数国家/地区免费使用Bard生成英语图像。这项新功能由我们更新的Imagen2模型提供支持,该模型旨在平衡质量和速度,提供高质量、逼真的输出。只需输入描述(例如“创建一只狗骑着冲浪板的图像”),Bard就会生成定制的、范围广泛的视觉效果,帮助您将想法变为现实。
图像生成功能由谷歌的新Imagen2模型实现,该公司表示,该模型提供了“迄今为止最高质量的图像,以及文本到图像系统经常遇到困难的领域的改进,例如渲染逼真的手和人类面部并保持图像没有分散注意力的视觉伪影。”
Imagen2经过更高质量的图像描述配对训练,并生成更详细的图像,更符合人们语言提示的语义。它比我们以前的系统在处理细节方面更准确,并且更能够捕捉细微差别-在各种风格和用例中提供更加真实的图像。
我在基本提示下尝试了新的图像生成功能,要求它创建山上徒步旅行者的图像。它弹出两张图像,一张更现实,一张更艺术。两个徒步旅行者都有登山杖,尽管我没有要。不过没关系,登山杖就是这样。看来该功能将立即广泛使用,所以开始创建吧!
除了图像生成之外,最新更新还为GeminiPro带来了更多语言。该公司已将GeminiPro引入巴德(英语),但该公司正在将该技术扩展到40多种语言。GeminiPro使巴德“在理解、总结、推理、编码和规划等方面的能力更强”。
语言模型和跨语言聊天机器人的领先评估者大型模型系统组织最近表示,Bard和GeminiPro是最受欢迎的聊天机器人之一(无论有或没有成本),并指出它已经取得了“惊人的飞跃”。我们的第三方评级机构进行的盲目评估表明,与领先的免费和付费替代方案相比,巴德的GeminiPro是表现最好的对话式人工智能之一。
随着Google最终与Bard合作进行图像创建,Yelp也开始使用AI来确定您在餐馆看到的食物图像。人工智能显然将以某种方式参与到我们所看到的事物中——即使它本身并不创建图像。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。