现在你可以使用ChatGPT进行语音聊天了以下是使用方法:
现在你可以使用ChatGPT进行语音聊天了
当OpenAI于3月发布了GPT-4时,其最大的优势之一就是其多模态功能,使ChatGPT能够接受图像输入。然而,多模态功能还没有准备好进行部署,直到现在。
周一,OpenAI宣布ChatGPT现在可以“看、听和说”,指的是这个受欢迎的聊天机器人现在可以接收图像和语音输入并以语音回复对话。
此外:亚马逊通过40亿美元投资Anthropic提升生成式AI的竞争力
图像输入功能可以帮助用户处理他们可以看到的事物,例如解决工作表上的数学问题、识别植物的名称或查看食品储藏室中的物品并提供食谱。
在上述所有情况下,用户只需拍摄他们所看到的东西的照片,并添加他们想要得到答案的问题。OpenAI透露,图像理解功能由GPT-3.5和GPT-4提供驱动。
语音输入和输出功能使ChatGPT具备了语音助手的功能。现在,要向ChatGPT提出任务请求,用户只需使用他们的声音,一旦ChatGPT处理完您的请求,它将口头回答您。
在OpenAI共享的演示中,用户口头要求ChatGPT讲一个关于刺猬的睡前故事。ChatGPT通过讲一个故事来回应,类似于亚马逊的Alexa等语音助手的功能。
此外:为什么开源是人工智能的摇篮
AI助手的AI支持竞赛正在进行,就在上周,亚马逊宣布它正在通过一个新的LLM来增强Alexa的功能,使她具备类似ChatGPT的功能,从根本上使她成为一个无需手动操作的人工智能助手。ChatGPT的语音集成实现了相同的结果。
为了支持语音功能,OpenAI使用Whisper作为其语音识别系统,将用户的口语转录成文本,并使用一种新的文本转语音模型,可以从文本中生成类似人类的音频,仅需几秒钟的语音。
为了创建ChatGPT的五种用户可选择的声音,该公司与专业配音演员合作。
语音和图像功能将仅在接下来的两周内适用于ChatGPT Plus和Enterprise。然而,OpenAI表示,它将很快扩大该功能的用户范围,如开发者等。
此外:我最喜欢的ChatGPT Plus插件及其令人瞩目的功能
如果您是Plus或Enterprise用户,要使用图像输入功能,您只需在聊天界面中点击照片按钮并上传图像。要使用语音功能,请转到设置<新功能,并选择语音对话。
由GPT-4支持的Bing Chat支持图像和语音输入,并且完全免费使用。因此,如果您想测试这些功能但尚未获得访问权限,Bing Chat是一个很好的选择。