2025年06月24日
当AI以破竹之势席卷千行百业,大模型技术正以惊人的速度迭代演进,重塑着智能世界的底层逻辑。
作为全球AIoT行业的引领者,移远通信通过持续迭代和探索,在端侧大模型解决方案上完成“三级跳”——在多模态感知、架构创新、模型兼容性三大核心维度实现跨越式突破,不仅重新定义了终端设备的智能化边界,更为AI普惠化落地开辟了全新路径。近日,移远基于SG885G AI 算力模组的端侧大模型解决方案,已成功运行LLaVA-7B、RWKV7、Qwen3-4B等大模型。
感知维度升级:引领多模态交互新范式
在智能终端的世界里,单一的语音对话或图像识别,已无法满足复杂场景的需求,多模态感知才是未来趋势。移远通信敏锐捕捉行业发展脉络,在感知维度上持续创新,打造出“超级感官系统”,并不断取得技术及应用突破。
自端侧大模型解决方案发布以来,移远通信基于全语音链路的方案已在德壹机器人项目中顺利落地,赋予机器人“能说会道”的本领,使其语音交互能力更加自然、流畅。
近日,移远成功在其SG885G模组上部署7B参数多模态大模型LLaVA,让移动端拥有“火眼金睛”,实现实时物体识别与场景理解,完成了感知维度的再次重大升级。这一突破,让移远成为业界首个提供端侧全模态感知解决方案的模组厂商。
值得一提的是,移远还通过架构级创新,实现了文本、语音、视觉三大模态的深度融合。这种融合并非简单的功能叠加,而是从底层架构出发,让不同模态的信息能够相互补充、相互促进,形成更全面、更准确的认知能力,使得客户终端能够在复杂的实际场景中实现更智能、更高效的交互。
架构创新探索:开辟端侧AI计算新维度
在Transformer架构主导大模型领域的当下,移远通信以前瞻性的眼光,积极布局非Transformer的技术路线,致力于为客户提供更低算力、更少内存消耗的解决方案。
日前,移远SG885G模组已实现成功运行RWKV7模型。RWKV(Receptance Weighted Key-Value)是一种极具创新性的神经网络架构,巧妙地融合了循环神经网络(RNN)的训练效率与Transformer的建模能力。其核心设计在于通过线性注意力机制取代传统Transformer的自注意力,这一改进有效解决了长序列处理中的计算瓶颈问题,同时还支持高效推理与并行训练,在计算效率和模型性能之间取得了良好的平衡。
RWKV架构在多语言处理、小说创作、长期记忆保持等多个领域表现出色,展现出了广泛的应用前景。移远通信成功将其部署在端侧模组上,意味着对于算力和内存资源有限的“小身板”终端设备,也能拥有强大的AI“大心脏”。
模型生态扩容:构建端侧大模型“超级平台”
在模型兼容性方面,移远通信构建了覆盖主流开源模型的端侧适配体系,打造出了功能强大的端侧大模型“超级平台”。从Llama到通义千问,再到DeepSeek,移远率先完成了对主流开源模型的全方位兼容,覆盖参数规模从0.5B到8B,为不同场景的智能终端提供了丰富的模型选择。
例如,移远通信在其SG885G AI算力模组上,成功实现Qwen3-4B模型的稳定运行,并对模型架构和运行环境进行深度优化。实测数据显示,相比Qwen2.5,优化后的Qwen3-4B模型,其平均响应延迟降低了40%,交互体验直线升级。
站在AI技术变革的潮头,移远通信始终坚信:未来的智能,不应局限于云端的数据中心,而应该广泛存在于每个终端、每个场景、每个人的掌心。通过持续的技术深耕与生态共建,移远通信正携手合作伙伴,让端侧大模型成为智能时代的“新基建”,推动AI技术在更广阔的领域实现普惠化应用。