在 ARM VPS 上用 llama.cpp 部署 Gemma 4 E2B 本地模型

2026年4月4日

| AI与工具

在 ARM VPS 上，使用 llama.cpp 的 Docker 镜像部署本地 LLM，记录从 Gemma 3 到 Gemma 4 的部署过程、性能测试和资源监控。背景：Gemma 4 发布 2026 年 3 月，Google DeepMind 发布了 Gemma 4 系列开源模型。Gemma 4 带来了多项重大升级：推理能力：全系模型支持可配置的思维链（Chain of Thought）推理模式多模态：支持文本、图像输入，小模型（E2B/E4B）额外支持音频 MoE + Dense 双架构：提供 Dense 和混合专家（Mixture-of-Experts）两种架构超长上下文：小模型 128K tokens，大模型 256K tokens 原生函数调用：支持 function calling，适用于 Agent 场景原生系统提示：首次原生支持 system role Gemma 4 共 4 个规格：模型架构有效参数上下文长度特点 E2B Dense 2.3B 128K 轻量高效，支持音频，适合手机/边缘设备 E4B Dense 4.5B 128K 平衡性能，支持音频 26B A4B MoE 3.……

阅读全文

Claude Code 完整使用手册

2026年1月7日

| AI与工具

引言 Claude Code 是由 Anthropic 公司开发的 AI 驱动的代码编辑器和开发助手。它将强大的 Claude AI 模型深度集成到开发环境中，为开发者提供前所未有的智能编程体验。与传统 IDE 的区别传统 IDE（如 VS Code、IntelliJ IDEA）主要提供代码编辑、语法高亮、调试等基础功能，而 Claude Code 通过以下方式重新定义了开发体验：自然语言交互：可以用中文或英文直接描述任务，无需记忆复杂的命令智能理解：能够理解整个代码库的上下文，跨文件进行推理自动化执行：从任务规划到代码实现，全自动完成多工具集成：集成文件操作、命令执行、浏览器测试等全套开发工具学习适应：随着使用，AI 会逐渐理解你的编码风格和项目需求核心优势效率提升：减少 70% 以上的重复编码工作质量保证：AI 帮助发现潜在 bug 和优化机会学习加速：实时解释代码逻辑，快速掌握新技术跨领域能力：前端、后端、DevOps 全栈支持安全可靠：本地化执行，代码不离开你的机器适用场景新项目快速原型开发代码重构和优化调试和问题排查学习新技术栈自动化脚本编写文档生成和维护测试用例编写安装和配置系统要求操作系统：macOS、Linux、Windows（WSL2） Node.js：v16 或更高版本（如使用 CLI 版本） IDE：Visual Studio Code（推荐）或支持的编辑器网络：稳定的互联网连接（访问 Anthropic API）安装方式方式一：VS Code 扩展（推荐）打开 VS Code 在扩展商店搜索 “Claude Code” 点击安装安装完成后，会在侧边栏看到 Claude Code 图标方式二：CLI 版本 # 使用 npm 安装 npm install -g @anthropic-ai/claude-code # 或使用 yarn yarn global add @anthropic-ai/claude-code # 验证安装 claude-code --version 初始化配置首次使用需要配置 API 密钥：……

阅读全文

adguard home 安装与配置

2024年5月29日

| AI与工具

引言 AdGuard Home 是一款网络级广告和跟踪器拦截器。它可以帮助你在家中或办公室的网络上拦截广告，保护隐私，并且提升上网速度。选择 AdGuard Home 的原因包括它的开源性质、易于配置和强大的功能。安装部署我们选择 docker + caddy 的方式使用 docker 部署 adguard adguard 提供了 docker 部署的方式: github地址建议使用 docker run --name adguardhome --restart unless-stopped -v /root/adguardhome/work:/opt/adguardhome/work -v /root/adguardhome/confdir:/opt/adguardhome/conf -p 53:53/tcp -p 53:53/udp -p 8080:80/tcp -p 4443:443/tcp -p 4434:443/udp -p 3000:3000/tcp -d adguard/adguardhome 配置 caddy yourdomain.com { reverse_proxy 127.0.0.1:3000 配置 adguard 访问 http://yourdomain.com:3000 进行配置访问 admin 配置页面修改 CaddyFile 文件，修改为配置 yourdomain.com { reverse_proxy 127.0.0.1:8080 配置 adguard 配置 DOH 需要配置上, 证书和密钥, 证书可以使用 acme.……

阅读全文

搭建了一个 chat-next-web 服务, 支持 GPT-4

2024年3月9日

| AI与工具

最近, 我搭建了一个 chat-next-web 服务, 支持 GPT-4, 你可以在这里https://chat.twotigers.xyz体验一下服务是基于 ChatGPT-Next-Web 当然你可以用你喜欢的客户端来进行链接进入后进行一次设置 , Endpoint && Key 可以关注微信公众号代码日记发送 gpt 关键词获取然后就可以开始聊天了……

阅读全文

分类 AI与工具中的文章

在 ARM VPS 上用 llama.cpp 部署 Gemma 4 E2B 本地模型

Claude Code 完整使用手册

adguard home 安装与配置

搭建了一个 chat-next-web 服务, 支持 GPT-4

最近文章

分类

标签

友情链接

其它

分类 AI与工具 中的文章

最近文章

分类

标签

友情链接

其它

分类 AI与工具中的文章