Phi-3 模型手机部署教程（微软发布的可与GPT-3.5媲美的小模型）

合集 - 人工智能(65)

1.Python之禅，开宗明义：import this2024-05-03 2.Python深入理解*和**含义和应用2024-05-03 3.[每日AI·0430]首个自主更新的多模态大模型，马斯克访华，文本一键转3D数字人骨骼动画，创新的虚拟试衣模型2024-05-03 4.国内免费的AI工具出色地帮我辅导女儿的小学英语作业2024-05-04 5.[每日AI·0506]巴菲特谈 AI，李飞飞创业，苹果或将推出 AI 功能，ChatGPT 版搜索引擎2024-05-06 6.AI已来，我与AI一起用Python编写了一个消消乐小游戏2024-05-10 7.玩转AI，笔记本电脑安装属于自己的Llama 3 8B大模型和对话客户端2024-05-12 8.一文彻底整明白，基于Ollama工具的LLM大语言模型Web可视化对话机器人部署指南2024-05-18 9.基于Llama 3搭建中文版（Llama3-Chinese-Chat）大模型对话聊天机器人2024-05-21 10.借助AI大模型，三分钟原创一部儿童故事短视频（附完整操作步骤）2024-05-31 11.[AI资讯·0531] 达摩院医疗AI新里程碑，OpenAI价值数十亿美元，微软投资130亿美元，百度文库成为一站式AI内容获取与创作平台，三大运营商完成AI产品市场，AI获得成功PMF需多次尝试……2024-05-31 12.本地部署GLM-4-9B清华智谱开源大模型方法和对话效果体验2024-06-08 13.ChatTTS 开源文本转语音模型本地部署、API使用和搭建WebUI界面（建议收藏）2024-06-09 14.[AI资讯·0609] SamAltman建立了庞大投资帝国，通义千问Qwen2发布即爆火，OpenAI泄密者公布165页文件，奥特曼百万年薪挖角谷歌TPU人才……2024-06-09 15.Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人2024-06-12 16.[AI资讯·0618] 快手AI模型可灵在质量优于Sora，OpenAI和谷歌发布新技术推动AI视频推理发展，Gemini1.5Pro在该榜单中表现突出2024-06-18 17.Stable Diffusion 3 大模型文生图“开源英雄”笔记本部署和使用教程，轻松实现AI绘图自由2024-06-18 18.[AI资讯·0622] Claude3.5超越GPT-4o，360推出AI搜索，OpenAI收购Rockset，华为发布大模型2024-06-22

19.Phi-3 模型手机部署教程（微软发布的可与GPT-3.5媲美的小模型）2024-06-23

20.大模型应用研发基础环境配置（Miniconda、Python、Jupyter Lab、Ollama等）2024-06-25 21.使用Llama3/Qwen2等开源大模型，部署团队私有化Code Copilot和使用教程2024-06-30 22.Google 发布了最新的开源大模型 Gemma 2，本地快速部署和体验2024-07-02 23.阿里Qwen2-72B大模型已是开源榜的王者，为什么还要推出其他参数模型，被其他模型打榜？2024-07-04 24.基于Qwen2/Lllama3等大模型，部署团队私有化RAG知识库系统的详细教程（Docker+AnythingLLM）2024-07-06 25.Ollama完整教程：本地LLM管理、WebUI对话、Python/Java客户端API应用2024-07-10 26.LivePortrait 数字人：开源的图生视频模型，本地部署和专业视频制作详细教程2024-07-14 27.基于 Qwen2 大模型微调技术详细教程（LoRA 参数高效微调和 SwanLab 可视化监控）2024-07-20 28.太卷了，阿里云免费1个月大模型算力额度，玩转Llama3.1/Qwen2等训练推理2024-07-27 29.PyTorch 训练自定义功能齐全的神经网络模型的详细教程2024-08-02 30.vLLM CPU和GPU模式署和推理 Qwen2 等大语言模型详细教程2024-08-11 31.MiniCPM-V 2.6 面壁“小钢炮”，多图、视频理解多模态模型，部署和推理实战教程2024-08-14 32.InternLM 2.5 书生·浦语开源大模型本地部署体验2024-08-24 33.GLM-4-Flash 大模型API免费了，手把手构建“儿童绘本”应用实战（附源码）2024-08-27 34.ChatTTS 长音频合成和本地部署2种方式，让你的“儿童绘本”发声的实战教程（文末有福利）2024-08-31 35.Agent(智能体)和 MetaGPT，一句话实现整个需求应用代码2024-09-07 36.基于 CrewAI 多智能体框架，手把手构建一个自动化写作应用实战2024-09-15 37.基于 Qwen2.5-Coder 模型和 CrewAI 多智能体框架，实现智能编程系统的实战教程2024-09-21 38.使用世界领先的 Qwen2.5-Math 开源模型当 AI 数学老师，让奥数解题辅导不在鸡飞狗跳（文末有福利）2024-09-28 39.transformers 推理 Qwen2.5 等大模型技术细节详解(一)transformers 初始化和对象加载（文末免费送书）2024-10-18 40.transformers 推理 Qwen2.5 等大模型技术细节详解(二)AutoModel 初始化和模型加载（免费送新书）2024-10-27 41.深入解析 Transformers 框架（三）：Qwen2.5 大模型的 AutoTokenizer 技术细节2024-11-01 42.告别 PPT 配图难题！Napkin.ai 轻松打造生动演示文档（文末免费送书）2024-11-04 43.深入解析 Transformers 框架（四）：Qwen2.5/GPT 分词流程与 BPE 分词算法技术细节详解2024-11-09 44.Meissonic 文生图模型：小参数，超轻量，本地部署推理教程2024-11-16 45.Transformers 框架任务概览：从零开始掌握 Pipeline（管道）与 Task（任务）2024-11-21 46.Transformers 框架 Pipeline 任务详解：文本转音频（text-to-audio 或 text-to-speech）2024-12-01 47.Transformers 框架 Pipeline 任务详解：文本分类（text-classification 或 sentiment-analysis）2024-12-05 48.Bolt.new 用一句话快速构建全栈应用：本地部署与应用实战（Ollama/Qwen2.5 等）2024-12-07 49.Transformers 框架 Pipeline 任务详解（三）：词元分类（token-classification）和命名实体识别2024-12-12 50.深入解析 Transformers 框架（五）：嵌入（Embedding）机制和 Word2Vec 词嵌入模型实战2024-12-13 51.Transformers 框架 Pipeline 任务详解（四）：问答（question-answering）2024-12-18 52.Transformers 框架 Pipeline 任务详解（五）：表格问答（table-question-answering）2024-12-22 53.Transformers 框架 Pipeline 任务详解（六）：填充蒙版（fill-mask）2024-12-25 54.深度解析 Transformer 模型中的位置嵌入（Positional Embedding）2024-12-29 55.使用Cursor + Qwen2.5 大模型零经验研发微信小程序：自由构建个性化节拍器应用实战01-03 56.Cline 免费插件 + Qwen2.5 大模型，零经验也能开发“对联王”微信小程序01-12 57.感谢有你，共赴未来：2024年微信公众号创作总结 · 老牛同学01-23 58.新春“码”启 | 0 基础开发微信小游戏，Cocos 游戏引擎 + AI 辅助编程（第1天）01-24 59.新春“码”启 | 0 基础开发微信小游戏，Cocos 游戏引擎 + AI 辅助编程（第2天）01-26 60.新春“码”启 | Cocos 3D 开发微信小游戏（第3天）：场景搭建与游戏链路基础开发01-28 61.新春“码”启 | Cocos 3D 开发微信小游戏（第4天）：游戏资源设计和框架核心源代码02-01 62.新春“码”启 | Cocos 3D 微信小游戏（第5天）：分包构建和上传发布（完美收官）02-06 63.DeepSeek vs. Qwen 大模型编程能力比拼，谁更适合作为你的 AI 辅助编程助手？02-09 64.欧拉角和四元数，3D 游戏开发中“旋转”难题的通俗讲解和应用实战02-15 65.MNN 手机本地部署 DeepSeek R1 和多模态大模型，告别服务器繁忙！02-21

前面几篇博文，老牛同学和大家一起在个人电脑部署了Qwen2、GLM4、Llama3、ChatTTS和Stable Diffusion等 LLM 大模型，也通过 API 和 WebUI 的方式完成了体验。

但是这些大模型因为部署在个人电脑本地，不能够随时携带。如果能在手机上部署大模型的话，老牛同学感觉很有意义，手机与我们的生活更为密切相关，并且手机上也有大量的个人数据，与大模型交互起来也更加方便。同时，在手机上跑个大模型，还是很酷！

老牛同学期望能通过本文，和大家一起完成这项很酷且有意义的事情。老牛同学用的是小米 10 Pro手机，其配置参数如下：

老牛同学手机配置

选择 Phi-3 微软开源模型

受限于手机 CPU 和内存等硬件配置，我们要选择小语言模型（SLM）。其中，阿里开源了Qwen2-0.5B和Qwen2-1.5B两款小尺寸模型，微软了开源Phi-3 Mini（3.8B）和Phi-3 medium（14B）两款尺寸模型。

由于之前我们在笔记本部署了Qwen2-7B大模型，本次我们就在手机部署Phi-3 Mini模型，顺便也体验一下不同科技公司的大模型产品，其效果可以媲美GPT-3.5大模型：

Phi-3性能评测报告

Qwen2-7B本地部署：Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API 调用和 WebUI 对话机器人

手机配置 Linux 环境（Termux 应用）

小米等安卓手机的基于 Linux 内核的操作系统，但是我们无法像在 Linux 那样执行 Linux 命令，因此我首先得配置一下 Linux 环境。

Termux是一个 Android 的终端模拟器，可以在 Android 设备上运行 Linux 命令和工具。Termux的 Android APP 可通过官网下载并安装：https://github.com/termux/termux-app/releases

当前官网的最新稳定版本：v0.118.1 - 2024-06-18 00.05

Termux安装文件

请根据手机情况，下载对应的 apk 文件。老牛同学下载的 apk 文件：termux-app_v0.118.1+github-debug_universal.apk

apk 安装成功后，打开Termux应用后，默认展示如下，就可以开始输入 Linux 命令了：

Termux应用界面

手机上安装 Linux 操作系统

首先，我们安装proot-distro系统管理工具，proot-distro可以非常方便在 Termux 中安装、卸载和运行Linux 的发行版本（包括：Ubuntu、Debian、Arch Linux 等）：

友情提示： 在手机中输入以下命令效率比较低，我们可以把命令发到微信，然后一条一条复制粘贴！

 pkg install proot-distro

proot-distro 安装成功之后，我们安装Debian操作系统：

 proot-distro install debian

Debian安装成功

最后，登录新安装的Debian操作系统：

 proot-distro login debian

登录之后，自动启动了Shell命令行终端：root@localhost:~#

可以执行相关的 Linux 命令了：

Debian系统命令

通过 Termux 安装 Phi-3 模型

通过上面的操作，我们已经在手机上安装好了Debian操作系统，接下来在Debian操作系统中安装Phi-3 Mini模型。

第一步： 在Debian系统中安装Ollama软件，没错，就是之前在个人电脑部署Llama3、Qwen2等大模型时，用于管理本地大模型的Ollama软件。由于我们在手机上安装了Debian系统，那么和电脑一样，Ollama也可以管理Debian系统本地部署的大模型：

 # 安装Ollama软件
curl -fsSL https://ollama.com/install.sh | sh

Ollama安装成功输出信息如下：

Ollama安装成功

第二步： 通过后台启动Ollama服务：nohup ollama serve &

我们用Ollama命令，查看 Ollama 信息，如：

查看版本：ollama -v
查看本地模型列表：ollama list（目前还没有部署模型，因此结果列表为空）

第三步： 通过Ollama安装并启动Phi-3 Mini模型：ollama run phi3:mini

Phi-3 Mini模型文件总大小为2.4GB左右，因此下载需要一点时间：

Phi-3 Mini安装成功

到此，Phi-3 Mini模型部署成功，我们可以体验手机上的大模型，比如：请用 100 个汉字解释一下，天空为什么是蓝色的？

Phi-3 Mini模型推理

总结

相比电脑端，手机的算力弱太多，就算老牛同学用的是最小尺寸的模型（Phi-3 Mini），其推理的速度还是慢得多。其内容的输出速度，比我手机打字都要慢。盯着屏幕，看着模型一个字一个字的输出，感觉也挺有趣 😁

目前 AI 是大热门，各大公司推出的大模型参数一个比一个大，能力一个比一个厉害。但大模型训练和推理成本均比较高昂，在很大程度上限制了其发展，因此大模型 AI 应用相对较少，或者说对我们生活影响还很小，因此其还有很大的发展空间。

而反观针对特定业务场景定制的小模型（比如Phi定制等），其成本就低得多，就能更有效地应用于各种垂直场景。

老牛同学觉得这种“小而美”的 AI 模型将会越来越多，也会越来越受欢迎！

关注本公众号，我们共同学习进步 👇🏻👇🏻👇🏻

微信公众号：老牛同学

Qwen2-7B 开源大模型

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API 调用和 WebUI 对话机器人

Llama-3-8B 开源大模型

玩转 AI，笔记本电脑安装属于自己的 Llama 3 8B 大模型和对话客户端

一文彻底整明白，基于 Ollama 工具的 LLM 大语言模型 Web 可视化对话机器人部署指南

基于 Llama 3 搭建中文版（Llama3-Chinese-Chat）大模型对话聊天机器人

GLM-4-9B 开源大模型

本地部署 GLM-4-9B 清华智谱开源大模型方法和对话效果体验

ChatTTS 文本转语音模型

ChatTTS 开源文本转语音模型本地部署、API 使用和搭建 WebUI 界面

Stable Diffusion 3 文生图模型

Stable Diffusion 3 文生图“开源英雄”大模型本地部署和使用教程，轻松实现 AI 绘图自由

大模型应用案例

借助 AI 大模型，三分钟原创一部儿童故事短视频（附完整操作步骤）

高效编写大模型 Prompt 提示词，解锁 AI 无限创意潜能

Python 小游戏

AI 已来，我与 AI 一起用 Python 编写了一个消消乐小游戏

Python 游戏编程：一步步用 Python 打造经典贪吃蛇小游戏

posted @ 2024-06-23 10:12 老牛啊阅读(867) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

· MNN 手机本地部署 DeepSeek R1 和多模态大模型，告别服务器繁忙！

· 使用ollama分别在我的window、mac、小米手机上部署体验llama3-8b

· Phi小模型开发教程：用C#开发本地部署AI聊天工具，只需CPU，不需要GPU，3G内存就可以运行，不输GPT-3.5

阅读排行：
· 10亿数据，如何做迁移？
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单！
· 推荐几款开源且免费的 .NET MAUI 组件库
· 易语言 —— 开山篇
· Trae初体验

奔跑的蜗牛·老牛同学

奔跑的蜗牛，记录的点滴：https://ntopic.cn

Phi-3 模型手机部署教程（微软发布的可与GPT-3.5媲美的小模型）

选择 Phi-3 微软开源模型

手机配置 Linux 环境（Termux 应用）

手机上安装 Linux 操作系统

通过 Termux 安装 Phi-3 模型

总结

公告

常用链接

我的标签

合集 (6)

随笔分类 (137)

博客空间

阅读排行榜

推荐排行榜

	# 安装Ollama软件
	curl -fsSL https://ollama.com/install.sh \| sh