谷歌发布gemini 1.5技术报告详细介绍gemini 1.5 pro模型架构改进情况-pg官网是哪个

站长之家(chinaz.com) 5月20日消息:google deepmind 发布了一份长达150页的技术报告，详细介绍了 1.5pro 和 gemini1.5flash 两个模型的性能特点和架构以及这个多模态大型模型的最新进展。

gemini1.5于今年2月上线，通过工程优化、moe架构等策略显著提升了性能和速度。该模型具有更长的上下文理解能力、更强的推理能力，能够处理跨模态内容。

报告中提到了两个新型号:

gemini1.5pro:在多个功能和基准测试中超越了2月份的版本。
gemini1.5flash:轻量级变体，旨在提高效率，性能损失极小。

gemini1.5flash是一个transformer解码器模型，拥有超过2m的上下文和多模态功能，优化了张量处理单元（tpu）的使用，并减少了模型服务延迟。它能够并行计算注意力和前馈分量，使用高阶预处理方法提高训练质量。

报告还评估了gemini1.5在处理英语、中文、日语和法语查询时，每个输出字符的平均时间。结果显示，gemini1.5flash在所有测试语言中实现了最快的生成速度。

此外，gemini1.5在跨模态长上下文检索任务上实现了近乎完美的召回，提高了长文档问答、长视频问答和长上下文自动语音识别的最佳水平，并在一系列广泛的基准测试中匹配或超越了gemini1.0ultra的性能。

gemini1.5pro在5月份的版本在多个推理、编码、视觉和视频基准测试中进行了改进，而音频和翻译性能保持不变。

报告还介绍了gemini1.5pro数学增强版本的性能，它在hendryck的math基准测试中取得了91.1%的突破性性能，解决了此前模型无法解决的亚太数学奥林匹克题目。

最后，报告强调了gemini1.5在现实世界的应用潜力，展示了它与专业人士合作完成任务的能力，在10个不同的工作类别中可节省26-75%的时间。此外，该模型还能学会将英语翻译成kalamang，一种只有不到200人使用的语言，与人类学习者的水平相当。

gemini1.5的技术报告展示了谷歌在大型多模态模型领域的最新进展，其性能的提升和应用潜力为未来的ai技术发展提供了新的方向。

详细报告:https://storage.googleapis.com/deepmind-media/gemini/gemini_v1_5_report.pdf

大家正在看

2024-05-152.3万阅读

谷歌gemini ai 计划为学校提供额外的数据保护和隐私

2024-05-172.2万阅读

2024-05-152.9万阅读

2024-05-152.4万阅读

2024-05-104656阅读

2024-05-021.2万阅读

2024-05-072.7万阅读

2024-05-156508阅读

2024-05-131.6万阅读

2024-05-159376阅读

2024-04-255302阅读

2024-05-212.1万阅读

谷歌gemini 1.5 pro面向全球开发者开放已支持200万tokens

2024-05-151.9万阅读

2024-05-154718阅读

pg官网是哪个-pg网赌游戏

it业界

热点视频

站长资讯

好物榜

更多分类

更多主题

谷歌发布gemini 1.5技术报告详细介绍gemini 1.5 pro模型架构改进情况-pg官网是哪个

推荐关键词

24小时热搜

大家正在看

谷歌gemini ai 计划为学校提供额外的数据保护和隐私

谷歌数学版gemini破解奥赛难题，堪比人类数学家！

山姆-奥特曼怒喷谷歌，gpt-4o抢了gemini风头

谷歌gemini对openai贴脸开大！文生视频模型veo硬刚sora

谷歌gemini 1.5 pro面向全球开发者开放已支持200万tokens

pg官网是哪个-pg网赌游戏

it业界

热点视频

站长资讯

好物榜

更多分类

更多主题

谷歌发布gemini 1.5技术报告 详细介绍gemini 1.5 pro模型架构改进情况-pg官网是哪个

推荐关键词

24小时热搜

大家正在看

谷歌gemini ai 计划为学校提供额外的数据保护和隐私

谷歌数学版gemini破解奥赛难题，堪比人类数学家！

山姆-奥特曼怒喷谷歌，gpt-4o抢了gemini风头

谷歌gemini对openai贴脸开大！文生视频模型veo硬刚sora

谷歌gemini 1.5 pro面向全球开发者开放 已支持200万tokens

谷歌发布gemini 1.5技术报告详细介绍gemini 1.5 pro模型架构改进情况-pg官网是哪个

谷歌gemini 1.5 pro面向全球开发者开放已支持200万tokens