谷歌表示★ღ,Gemma 3n 代表了设备端 AI 的重大进步★ღ,它为手机★ღ、平板★ღ、笔记本电脑等端侧设备带来了强大的多模式功能★ღ,其性能去年还只能在云端先进模型上才能体验★ღ。
多模态设计★ღ:Gemma 3n 原生支持图像★ღ、音频★ღ、视频和文本输入和文本输出★ღ。专为设备端优化★ღ:Gemma 3n 型号以效率为设计重点★ღ,提供两种基于有效参数尺寸★ღ:E2B 和 E4B★ღ。虽然它们的原始参数数量分别为 5B 和 8B★ღ,但架构创新使其运行内存占用与传统的 2B 和 4B 型号相当★ღ,仅需 2GB (E2B) 和 3GB (E4B) 内存即可运行★ღ。架构突破★ღ:Gemma 3n 的核心是全新组件★ღ,例如用于计算灵活性的 MatFormer 架构★ღ、用于提高内存效率的每层嵌入 (PLE) 以及针对设备用例优化的新型音频和基于 MobileNet-v5 的视觉编码器★ღ。质量提升★ღ:Gemma 3n 在多语言(支持 140 种文本语言和 35 种语言的多模态理解)宫下杏奈★ღ、数学★ღ、编码和推理方面均实现了质量提升★ღ。E4B 版本的 LMArena 得分超过 1300★ღ,使其成为首个达到此基准的 100 亿参数以下模型★ღ。
谷歌表示★ღ,要想实现设备性能的飞跃需要彻底重新思考模型★ღ。Gemma 3n 独特的移动优先架构是其基础★ღ,而这一切都始于 MatFormer★ღ。
Gemma 3n 的核心是 MatFormer(Matryoshka Transformer) 架构★ღ,这是一种专为弹性推理而构建的新型嵌套 Transformer★ღ。你可以将其想象成俄罗斯套娃★ღ:一个较大的模型包含其自身更小★ღ、功能齐全的版本★ღ。这种方法将俄罗斯套娃表征学习的概念从单纯的嵌入扩展到所有 Transformer 组件★ღ。
因此★ღ,MatFormer 在训练 4B 有效参数 (E4B) 模型时★ღ,会同时优化 2B 有效参数 (E2B) 子模型★ღ,如上图所示★ღ。这为开发者提供了两项强大的功能和用例★ღ:
预提取模型★ღ:开发者可以直接下载并使用 E4B 模型以获得更高性能宫下杏奈★ღ,或者使用已提取的独立 E2B 子模型★ღ,提供两倍更快的推理速度★ღ。使用 Mix-n-Match 自定义尺寸★ღ:为了根据特定硬件限制进行更精细的控制★ღ,你可以使用谷歌称之为 Mix-n-Match 的方法★ღ,在 E2B 和 E4B 之间创建一系列自定义尺寸的模型★ღ。这项技术允许人们精确地对 E4B 模型的参数进行切片★ღ,主要通过调整每层的前馈网络隐藏层维度(从 8192 到 16384)并选择性地跳过某些层来实现★ღ。谷歌还将发布 MatFormer Lab★ღ,以展示如何检索这些最佳模型★ღ,这些模型是通过在 MMLU 等基准测试中评估各种设置而确定的★ღ。
展望未来★ღ,MatFormer 架构也为弹性执行铺平了道路宫下杏奈★ღ。虽然此功能不属于今天发布的实现★ღ,但它允许单个部署的 E4B 模型在 E4B 和 E2B 推理路径之间动态切换★ღ,从而根据当前任务和设备负载实时优化性能和内存使用情况★ღ。
Gemma 3n 模型采用了逐层嵌入 (PLE) 技术★ღ。这项创新专为设备部署而设计★ღ,可大幅提高模型质量★ღ,同时不会增加设备加速器 (GPU/TPU) 所需的高速内存占用★ღ。
虽然 Gemma 3n E2B 和 E4B 模型的总参数数量分别为 5B 和 8B★ღ,但 PLE 允许很大一部分参数(与每层相关的嵌入)在 CPU 上加载并高效计算★ღ。这意味着只有核心 Transformer 权重(E2B 约为 2B★ღ,E4B 约为 4B)需要存储在通常较为受限的加速器内存 (VRAM) 中★ღ。
通过每层嵌入★ღ,你可以使用 Gemma 3n E2B★ღ,同时仅在 AI 加速器中加载约 2B 个参数★ღ。
处理长内容输入(例如来自音频和视频流的序列)对于许多先进的设备端多模态应用至关重要★ღ。Gemma 3n 引入了键值缓存共享 (KV Cache Sharing)★ღ,旨在加快流式响应应用的首个 token 获取时间 (Time-to-first-token)★ღ。
KV Cache Sharing 优化了模型处理初始输入处理阶段(通常称为「预填充」阶段)的方式★ღ。来自局部和全局注意力机制的中间层的键和值将直接与所有顶层共享★ღ,与 Gemma 3 4B 相比★ღ,预填充性能显著提升了两倍★ღ。这意味着模型能够比以往更快地提取和理解较长的提示序列★ღ。
在语音方面★ღ,Gemma 3n 采用基于通用语音模型(USM)的高级音频编码器★ღ。该编码器每 160 毫秒的音频生成一个 token(约每秒 6 个 token)★ღ,然后将其作为语言模型的输入进行集成★ღ,从而提供声音上下文的精细表示★ღ。
自动语音识别 (ASR)★ღ:直接在设备上实现高质量的语音到文本的转录★ღ。自动语音翻译 (AST)★ღ:将口语翻译成另一种语言的文本★ღ。
经过实践可知★ღ,Gemma 3n 在英语与西班牙语★ღ、法语凯发app手机版下载★ღ,★ღ、意大利语★ღ、葡萄牙语之间的翻译 AST 效果尤为出色宫下杏奈★ღ。对于语音翻译等任务★ღ,利用「思维链」提示可以显著提升翻译效果K8凯发旗舰厅(中国)官方网站★ღ。以下是示例★ღ:
Gemma 3n 编码器在发布时已可以处理长达 30 秒的音频片段★ღ,但这并非极限★ღ。底层音频编码器是一个流式编码器★ღ,能够通过额外的长音频训练处理任意长度的音频★ღ。后续的实现将解锁低延迟★ღ、长流式传输应用程序★ღ。
除了集成的音频功能外★ღ,Gemma 3n 还配备了全新的高效视觉编码器 MobileNet-V5-300M★ღ,为边缘设备上的多模态任务提供最先进的性能★ღ。
多种输入分辨率★ღ:本机支持 256×256★ღ、512×512 和 768×768 像素的分辨率★ღ,让开发者能够平衡特定应用的性能和细节★ღ。通用的视觉理解★ღ:在广泛的多模式数据集上进行了联合训练★ღ,在各种图像和视频理解任务中表现出色★ღ。高吞吐量★ღ:在 Google Pixel 上每秒处理高达 60 帧K8凯发旗舰厅(中国)官方网站★ღ,实现实时设备视频分析和交互式体验凯发K8旗舰厅★ღ。
得益于新架构设计和先进蒸馏技术★ღ,MobileNet-V5-300M 在 Gemma 3 中的表现显著优于基线 SoViT(使用 SigLip 训练★ღ,未进行蒸馏)★ღ。在 Google Pixel Edge TPU 上★ღ,它在量化的情况下实现了 13 倍的加速(不使用量化的情况下为 6.5 倍)★ღ,所需参数减少了 46%★ღ,内存占用减少了 4 倍★ღ,同时在视觉语言任务上实现了更高的准确率★ღ。
5 月 20 日★ღ,谷歌 DeepMind 在 I/O 大会上宣布了 Gemma-3nk8凯发国际★ღ,★ღ,其小体量★ღ、高性能和低内存占用的特性让人印象深刻★ღ。
谷歌的首个 Gemma 模型于去年年初发布★ღ,目前该系列的累计下载量已经超过了 1.6 亿次★ღ。
金色的★ღ,那是拼搏★ღ,是挑灯夜读时酸涩难睁的双眼★ღ,是运动会上体力透支尚不愿认输的倔强★ღ,是为维护班级★ღ、学校的荣誉而不懈奋斗的汗水……金色的拼搏★ღ,灌溉出金色的果实★ღ,笑开了一张张疲惫而青春的脸K8凯发旗舰厅(中国)官方网站★ღ。
“嗯★ღ,东西不错★ღ。”那为首的男子点头K8凯发旗舰厅(中国)官方网站★ღ,持着宝骨看了又看凯发k8官网首页物流公司★ღ,★ღ,道★ღ:“喏★ღ,给你十枚精璧★ღ,这块符骨我们买了★ღ。”说罢★ღ,他丢下一些晶莹的块状物★ღ,转身就走★ღ。
四族人马灰溜溜的走了★ღ,兴师动众而来★ღ,结果却这么大败而去★ღ,实在是凄惨无比★ღ,被人镇压宫下杏奈★ღ,还要拿宝血来赎人★ღ,实在憋气★ღ。
06月25日,河北围场★ღ:木兰夜校 让指尖上的非遗剪纸技艺闪光,第二★ღ,议程设置失灵★ღ。新任领导刚上任★ღ,却没有提出让民众有感的重大改革行动★ღ,欠缺议程设置能力★ღ,迄未展现其领导能力K8凯发旗舰厅(中国)官方网站★ღ,无法主导政治议程★ღ,反而任由蓝白“在野”党主导议题引领风潮★ღ。,亿博体育足球,大发手机版App,世博体育官网入口★ღ。
作为一张信用卡★ღ,招商银行信用卡在消费过程中给人们带来了很大的方便★ღ。但是★ღ,如果出现逾期★ღ,就会给消费者带来一系列的问题★ღ。下面金融啦小编整理下文★ღ,介绍下招商信用卡逾期几天会上个人信用? 一★ღ、招商信用卡逾期几天会上个人信用逾期超过三天则会上信用★ღ。招行信用卡为用户提供三天的宽限期★ღ,因此招商信用卡还款...
他现在一路驰骋★ღ,只要停下来就立刻吃食物★ღ,然后休息★ღ,大山中太过危险★ღ,没有一点时间可以奢侈的浪费★ღ,必须留以养精蓄锐宫下杏奈★ღ。
06月25日,打卡派出所★ღ,何必“自投罗网”,冬季体育锻炼凯发k8官网首页★ღ,★ღ,由于肌肉不断收缩★ღ,呼吸加快★ღ,新陈代谢旺盛★ღ,身体产生的热量增加★ღ。同时还增强了大脑皮层的兴奋性K8凯发旗舰厅(中国)官方网站★ღ,使体温调节中枢灵敏★ღ、准确地调节体温★ღ,提高人们的御寒能力★ღ。所以★ღ,坚持冬季锻炼的人★ღ,抗寒能力比一般增强8-10倍★ღ。,必发手机登录,腾讯欢乐十三张,酷游体育平台下载★ღ。
新闻信息服务许可证音像制品出版许可证广播电视节目制作经营许可证网络视听许可证网络文化经营许可证山东省互联网传媒集团主办联系电话 违法不良信息举报电话
联系电话:13825243438(微信同号)
EMAIL:sales@jbjbl.com
深圳市宝安区航城街道九华新科技园3栋1楼
Copyright © 2018-2020 PbootCMS All Rights Reserved.湘ICP备88888888号