Google宣布推出Gemini Live,旨在显著提升语音对话体验,其具备更强的语言理解能力,能够在同一对话中识别并处理多种语言、方言及口音,进一步提高翻译精度。未来,Google计划为Gemini Live加入屏幕共享及实时视频流功能,进一步增强互动性。
此前的2月5日,Google发布了Gemini 2.0,增强了推理能力和多模态支持,支持文本、图像与语音处理。该版本提供三个不同版本:2.0 Flash(普通用户)、2.0 Flash-Lite(开发者)和2.0 Pro Experimental(高推理需求用户)。此外,推出了如Project Astra(多语言对话处理)、Jules(GitHub代码助手)和Game AI(实时游戏分析)等创新应用,并探索其在机器人领域的应用。
#谷歌 #Gemini #人工智能 #更新 #科技