登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
MNN 手机本地部署 DeepSeek R1 和多模态大模型,告别服 ...
MNN 手机本地部署 DeepSeek R1 和多模态大模型,告别服务器繁忙!
[ 复制链接 ]
钨哄魁
2025-6-1 21:56:32
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
在
Phi-3
大模型发布之际,我们基于
Termux
应用,在我的小米手机部署了
Phi-3
模型:文章地址
Termux
应用是一个终端模拟器,它允许我们安装 Linux 操作系统,然后在 Linux 操作系统中安装 Ollama,最后基于 Ollama 下载和推理大模型,虽然方法可行,但是存在一些局限:
操作步骤繁琐,用户体验较差:安装 Linux 操作系统、启动系统、安装和启动 Ollama 等操作,都需要通过命令行完成,体验较差。
资源消耗较大:手机内存有限,Termux 应用、Linux 操作系统、Ollama 框架等都需要消耗资源,推理速度较慢,资源吃紧
DeepSeek R1 很火爆,导致在使用 DeepSeek R1 时,老牛同学经常会遇到“服务器繁忙,请稍后重试。”的问题:
今天老牛同学推荐一款更加先进的应用:
MNN Chat
,它是由阿里巴巴开源的全功能多模态模型应用。
仅需一台手机即可运行: 完全在设备本地运行,确保数据隐私,无需将信息上传至外部服务器。
CPU 推理优化: 在安卓平台上,MNN-LLM 展现了卓越的 CPU 性能,预填充速度相较于 llama.cpp 提高了 8.6 倍,相较于 fastllm 提升了 20.5 倍,解码速度分别快了 2.3 倍和 8.9 倍。
多模态支持: 提供多种任务功能,包括文本生成文本、图像生成文本、音频转文本及文本生成图像。
广泛的模型兼容性: 支持多种领先的模型提供商,包括 Qwen、Gemma、Llama(涵盖 TinyLlama 与 MobileLLM)、Baichuan、Yi、DeepSeek、InternLM、Phi、ReaderLM 和 Smolm 等。
官网地址:https://www.mnn.zone
GitHub 源码地址:https://github.com/alibaba/MNN
接下来,我们在手机上部署试用一下,老牛同学的手机配置如下:
1.安装 MNN 应用
对于 Android 手机,我们可以直接下载和安装最新版本:下载地址
或者,我们也可以按照以下步骤,自己编译 Android 和 iOS 应用:
Android 编译和使用
克隆 MNN 源代码:git clone https://github.com/alibaba/MNN.git
构建库:
cd project/android
mkdir build_64
../build_64.sh "-DMNN_LOW_MEMORY=true -DMNN_CPU_WEIGHT_DEQUANT_GEMM=true -DMNN_BUILD_LLM=true -DMNN_SUPPORT_TRANSFORMER_FUSE=true -DMNN_ARM82=true -DMNN_USE_LOGCAT=true -DMNN_OPENCL=true -DLLM_SUPPORT_VISION=true -DMNN_BUILD_OPENCV=true -DMNN_IMGCODECS=true -DLLM_SUPPORT_AUDIO=true -DMNN_BUILD_AUDIO=true -DMNN_BUILD_DIFFUSION=ON -DMNN_SEP_BUILD=ON"
复制代码
复制到 LLM Android 应用项目:
mkdir -p ../../../apps/Android/MnnLlmChat/app/src/main/jniLibs/arm64-v8a
find . -name "*.so" -exec cp {} ../../../apps/Android/MnnLlmChat/app/src/main/jniLibs/arm64-v8a \;
复制代码
构建 Android 应用项目并安装:
cd ../../../apps/Android/MnnLlmChat
./gradlew installDebug
复制代码
iOS 应用编译和使用
克隆 MNN 源代码:git clone https://github.com/alibaba/MNN.git
编译 MNN.framework:
cd MNN/
sh package_scripts/ios/buildiOS.sh "-DMNN_ARM82=true -DMNN_LOW_MEMORY=true -DMNN_SUPPORT_TRANSFORMER_FUSE=true -DMNN_BUILD_LLM=true -DMNN_CPU_WEIGHT_DEQUANT_GEMM=true
-DMNN_METAL=ON
-DMNN_BUILD_DIFFUSION=ON
-DMNN_BUILD_OPENCV=ON
-DMNN_IMGCODECS=ON
-DMNN_OPENCL=OFF
-DMNN_SEP_BUILD=OFF
-DMNN_SUPPORT_TRANSFORMER_FUSE=ON"
复制代码
拷贝 framework 到 iOS 项目中:
mv MNN-iOS-CPU-GPU/Static/MNN.framework /apps/iOS/MNNLLMChat/MNN.framework
复制代码
确保 Link Binary With Libraried 中包含 MNN.framework,和其他三个 Framework:
如果没有包含,可以手动添加 MNN.framework:
修改 iOS 签名并编译项目
cd /apps/iOS/MNNLLMChat
open MNNLLMiOS.xcodeproj
复制代码
在 Xcode 项目属性中 Signing & Capabilities > Team 输入自己的账号和 Bundle Identifier:
等待 Swift Package 下载完成之后,进行编译使用。
2.下载模型文件
手机上安装好
MNN Chat
应用之后,我们打开应用,就可以看到它所兼容的模型列表,包括文本、音频、图像等:
点击即可下载,老牛同学想体验一下文本和图片识别,下载了
DeepSeek-R1-7B-Qwen-MNN
和
Qwen2-VL-2B-Instruct-MNN
这 2 个大模型,等待下载完成。
3. MNN 模型推理
先试用一下
DeepSeek-R1-7B-Qwen-MNN
文本模型,输入提示词:
同样是一年,为什么阳历固定12个月,而阴历却有闰月?
复制代码
DeepSeek R1 开始思考,分析阳历和阴历的计算方法,最终得出结论:
从手机的推理速率来看,总体还算不错,比通过
Termux
应用的方式推理效率高多了。
接下来,看看
Qwen2-VL-2B-Instruct-MNN
图片多模态大模型,老牛同学让它进行车牌识别:
可以看到,识别的结果是很不错的!
还有其他的大模型,包括音频、图片生成(Stable Diffusion)等,大家可以体验一下。
Cocos 3D 小游戏:
01.技术选型 丨 02.研发流程 丨 03.小游戏框架丨 04.核心架构设计丨 05.分包构建发布
Transformers 框架序列:
01.包和对象加载中的设计巧思与实用技巧
02.AutoModel 初始化及 Qwen2.5 模型加载全流程
03.Qwen2.5 大模型的 AutoTokenizer 技术细节
04.Qwen2.5/GPT 分词流程与 BPE 分词算法技术细节详解
05.嵌入(Embedding)机制和 Word2Vec 实战
06.位置嵌入(Positional Embedding)
Pipeline NLP 任务序列:
零·概述 丨 01.文本转音频 丨 02.文本分类 丨 03.词元分类和命名实体识别 丨 04.问答 丨 05.表格问答 | 06.填充蒙版
往期推荐文章:
Cline 免费插件 + Qwen2.5 大模型,零经验也能开发“对联王”微信小程序
使用 Cursor + Qwen2.5 大模型 零经验研发微信小程序:自由构建个性化节拍器应用实战
Bolt.new 用一句话快速构建全栈应用:本地部署与应用实战(Ollama/Qwen2.5 等)
基于 Qwen2.5-Coder 模型和 CrewAI 多智能体框架,实现智能编程系统的实战教程
vLLM CPU 和 GPU 模式署和推理 Qwen2 等大语言模型详细教程
基于 Qwen2/Lllama3 等大模型,部署团队私有化 RAG 知识库系统的详细教程(Docker+AnythingLLM)
使用 Llama3/Qwen2 等开源大模型,部署团队私有化 Code Copilot 和使用教程
基于 Qwen2 大模型微调技术详细教程(LoRA 参数高效微调和 SwanLab 可视化监控)
ChatTTS 长音频合成和本地部署 2 种方式,让你的“儿童绘本”发声的实战教程
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
MNN
手机
本地
部署
DeepSeek
相关帖子
手把手教你用Python做本地AI聊天机器人最终实战篇
手把手教你用Python做本地AI聊天机器人最终实战篇
手把手教你用Python做本地AI聊天机器人最终实战篇
手把手教你用Python做本地AI聊天机器人最终实战篇
手把手教你用Python做本地AI聊天机器人最终实战篇
手把手教你用Python做本地AI聊天机器人最终实战篇
手把手教你用Python做本地AI聊天机器人最终实战篇
手把手教你用Python做本地AI聊天机器人最终实战篇
Fedora 43物理机部署复盘
Docker容器化部署实战:从零构建Spring Boot微服务镜像
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
手把手教你用Python做本地AI聊天机器人最终实战篇
0
10
喳谍
2026-04-03
安全
手把手教你用Python做本地AI聊天机器人最终实战篇
0
13
幽淆
2026-04-03
安全
手把手教你用Python做本地AI聊天机器人最终实战篇
2
18
各卧唯
2026-04-03
安全
手把手教你用Python做本地AI聊天机器人最终实战篇
0
15
骛扼铮
2026-04-03
安全
手把手教你用Python做本地AI聊天机器人最终实战篇
1
16
师悠逸
2026-04-03
安全
手把手教你用Python做本地AI聊天机器人最终实战篇
1
17
呼延冰枫
2026-04-03
安全
手把手教你用Python做本地AI聊天机器人最终实战篇
2
14
澹台忆然
2026-04-03
安全
手把手教你用Python做本地AI聊天机器人最终实战篇
0
789
栓汨渎
2026-04-03
业界
Fedora 43物理机部署复盘
1
698
贡醮
2026-04-04
安全
Docker容器化部署实战:从零构建Spring Boot微服务镜像
2
437
迁岂罚
2026-04-04
回复
(17)
卜笑
2025-12-15 23:22:30
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
感谢分享,学习下。
粹脍誊
2026-1-1 00:35:39
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
感谢分享
糙昧邵
2026-1-15 21:57:23
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
前排留名,哈哈哈
颖顿庐
2026-1-18 20:13:47
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
分享、互助 让互联网精神温暖你我
俏挺喳
2026-1-25 09:11:36
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个好,看起来很实用
里豳朝
2026-1-26 07:40:22
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
前排留名,哈哈哈
劳暄美
2026-1-26 17:56:22
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢,下载保存了
狙兕
2026-1-28 10:26:04
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
谢谢分享,辛苦了
空娅芬
2026-2-4 10:12:51
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
前排留名,哈哈哈
喳谍
2026-2-8 10:03:11
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
前排留名,哈哈哈
廖彗云
2026-2-10 17:59:14
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
过来提前占个楼
衣旱
2026-2-12 20:02:35
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
谢谢楼主提供!
习和璧
2026-2-12 22:19:03
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个好,看起来很实用
睁扼妤
2026-2-21 04:13:20
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
鼓励转贴优秀软件安全工具和文档!
嗦或
2026-2-26 03:33:11
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
喜欢鼓捣这些软件,现在用得少,谢谢分享!
贼瘁
2026-3-2 06:38:33
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
不错,里面软件多更新就更好了
郗燕岚
2026-3-2 14:49:33
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
喜欢鼓捣这些软件,现在用得少,谢谢分享!
溥价
2026-3-11 04:45:43
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
感谢分享,学习下。
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
业界
签约作者
程序园优秀签约作者
发帖
钨哄魁
2026-3-11 04:45:43
关注
0
粉丝关注
27
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991126
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
神泱
9516
6
韶又彤
9910
7
荪俗
8995
8
宋子
9875
9
蓬森莉
9869
10
俞瑛瑶
10000
查看更多
今日好文热榜
46
【渗透测试】玄机&Maze 全过程wp
270
"Meta-Harness: End-to-End Optimization o
393
UI 自动化测试产品深度对比分析报告
232
指派问题WebApp实验室:从建模到智能分配的
899
MyBatis-Plus实战:Spring Boot数据库操作
556
指派问题WebApp实验室:从建模到智能分配的
835
《思想合奏:一场关于“自感即界面即自我”
593
【OpenClaw】通过 Nanobot 源码学习架构 --
486
AI时代如何临摹项目:Vault跨项目持久化存
530
AI时代如何临摹项目:Vault跨项目持久化存
889
AI时代如何临摹项目:Vault跨项目持久化存
882
读2025世界前沿技术发展报告33深海装备与技
995
AI时代如何临摹项目:Vault跨项目持久化存
174
《思想合奏:一场关于“自感即界面即自我”
98
深度学习进阶(四)Transformer 整体结构
121
XXL-JOB v3.4.0 发布 | OpenClaw集成、合并
8
我用缠论 + AI,做了一个 A 股智能分析系统
101
开发实战:asp.net core + ef core 实现动
136
Apache Kafka实战:Spring Boot消息队列完
709
vue3Crush以及对比vue2