【重磅升级】ChatGPT将新增“看、听、说”功能,AI进化迈入新征程!
点击上方【电脑技术荟】关注我!
正文
01
内容介绍
近日,OpenAI宣布其聊天机器人ChatGPT将迎来一次令人振奋的重大更新,这次更新将具备“看、听、说”的能力!是的,你没听错,ChatGPT现在不仅能够理解和生成文本,还具有语音和图像功能。这是AI技术的一大突破,将为我们的生活和工作带来更多可能性。
在未来的2周内,ChatGPT付费Plus用户和企业服务商可以率先体验这个新功能,之后再逐渐向免费用户开放。
ChatGPT 安卓版Android 应用程序正式发布了!快来下载使用吧
据悉,用户可以在苹果IOS或安卓(Android)手机版APP上使用,通过语音对话的方式,向ChatGPT发送对话,进行语音交流。这有点类似AI语音助手——微软siri式的交流方式。
多模态交互方式将为您提供更多在生活中使用 ChatGPT 的方式。例如,在旅行时拍摄地标的照片,并实时讨论其中的有趣之处。当您回到家时,拍下冰箱和食品储藏室的照片,以了解晚餐吃什么(并询问后续问题以获取食谱)。晚餐后,通过拍照、圈出问题并让它来帮助您的孩子来解决学习问题。
你可以随时随地地通过语音来与ChatGPT进行对话。ChatGPT也将会以语音的方式向你回复。新的语音功能由新的文本转语音模型提供支持,能够仅从文本和几秒钟的样本语音中生成类似人类的音频。
要开始使用语音,需要在手机上先进行设置,依次点击“设置”→“新功能”,选择加入语音对话。然后,点击主屏幕右上角的按钮,共有五种不同的语音供你选择。
另外,还可以向 ChatGPT 发送一张或多张图像,然后让ChatGPT为你识别并帮你分析,图像理解由多模态 GPT-3.5 和 GPT-4 提供支持。
例 如:要排查烧烤炉无法启动的原因,探索冰箱中的物品来计划膳食,或分析复杂的图表以获取与工作相关的数据等等。
OpenAI 的目标是构建安全且有益的 AGI。目前,多模态功能已经成为各家AI大模型的必争之地。不仅仅是ChatGPT,Meta最近推出了AudioCraft,通过AI技术生成音乐,谷歌的Bard以及必应机器人也都已经部署了多模式功能。
随着AI技术的不断发展,AI机器人的感知、交互和生成能力也得到了极大的提升。而语音和图像数据的大小与文本显着不同,这也意味着我们将能够通过更丰富的信息进行交流。
未来,随着应用场景和生态的进一步丰富,AI技术将进入更多领域,为我们的生活带来更多便利和惊喜。让我们共同期待一个充满智能和美好的未来!
02
创作加油站
1、【点赞转发】:
喜欢的文章可收藏,同时也请为文章多多点赞或分享给有需要的朋友。
2、【打赏鼓励】:
任意打赏,鼓励一下给作者加个油,有问题可留言,感谢您的支持和鼓励,这是激发作者持续热情创作的动力和源泉!
END
直接点击文字链接,即可查看相关教程文章详情。
免责声明】
1、本平台文章均为原创,分享内容仅供个人研究使用,请勿用于商业用途,转载请注明出处,违者必究。
2、文中所涉相关软件、图片、音频、视频等资源均来自互联网,仅供学习参考之用,版权归原著所有,如有侵权,请联系删除。