Nuteo Platform v3.5

Nuteo Platform v3.5

Overview Nuteo Platform 是一款面向现代企业的全栈 ERP 系统。3.5 版带来多智能体编排和自主工作流能力——专为需要不仅仅是任务管理的团队设计。 Tech Stack Frontend: Next.js 16 (App Router, TypeScript, Tailwind) Backend: Node.js APIs + Supabase (self-hosted) AI: Ollama + MiniMax-M2.7 / GLM-5.1 (本地 LLM 编排) Database: PostgreSQL via Supabase Infrastructure: Docker, Ubuntu 24.04, Cloudflare Key Features 多租户 SaaS 架构 实时协作 (WebSocket) AI 驱动的自动化流程 自定义工作流构建器 (拖放) 基于角色的访问控制 API 优先设计 Status 🟢 Active Development — 小团队生产就绪 Stack: Next.js · Supabase · Ollama · Docker

2025年5月20日 · nuteo
本地AI:在2026年运行本地LLM

本地AI:在2026年运行本地LLM

为什么2026年要在本地运行AI 每周都有新的AI工具想要你的数据。每月都有关于prompt injection的新闻。每季度都有初创公司收集了太多训练数据。 我自2024年以来一直在运行本地LLM。在2026年,体验与两年前完全不同。曾经需要32GB内存的模型现在可以在8GB上运行。曾经以分钟计算的推理速度现在以每秒token数计算。本地和云质量之间的差距显著缩小。 这不是边缘爱好者的专属了。它是一个合法的基础设施选择。 真正有效的方法 硬件现实检查 2026年运行本地LLM不需要GPU。我这么说是因为我已经在ThinkPad T14上运行集成显卡运行了六个月。结果比GPU设置慢,但足够用于实际工作。 纯CPU推理配合llama.cpp现在可以在现代笔记本电脑上以8-12 tokens/秒处理7B模型。这对于起草、编码辅助和研究足够用了。对于微调或重型批处理不可用。 GPU加速改变一切。RTX 3060(12GB)以20+ tokens/秒运行4位量化的70B模型。M3 MacBook Pro可以轻松处理13B模型。硬件的ROI已显著转变 — 二手3060比Claude Max的一年订阅便宜。 2026年的模型格局 小但强大(7B-13B): Qwen 2.5、Phi-4、Gemma 3B。在消费级硬件上运行。对于编码辅助和快速草稿,通常足够。优势:快速、私密、无速率限制。 中等层级(20B-35B): Mistral Small、Command R+、DeepSeek V3。更好的推理、更长的上下文窗口、更细腻的输出。需要更多RAM或GPU。这是大多数专业用例所在的地方。 大型层级(70B+): Llama 4、DeepSeek R2、Qwen 2.5 Ultra。接近大多数任务的云前沿质量。需要专用GPU或大量云支出。对于大多数用户不值得,除非有特定需求。 我实际使用的技术栈 经过两年的迭代,这是我日常工作中的内容: Ollama作为运行时。它处理模型管理、API兼容性和硬件检测。ollama run命令比我尝试过的任何其他方式都简单。 open-webui作为界面。这是我如果有时间会构建的东西。干净、快速、支持图像上传、内置RAG。 自定义API包装器用于特定任务。我有脚本调用本地API进行代码审查、文档摘要和泰英翻译。它们在计算成本和数据暴露方面代价为零。 隐私论点 这里变得严肃了。 你发送给云API的每个prompt都是一个数据点。一些公司在上面训练。一些被泄露。一些更改条款,蓦然回首你的内部文档就在训练运行中。 本地推理意味着这些都不会发生。你的prompts留在你的机器上。你的文档永远不会离开你的网络。权衡是维护 — 你自己运行技术栈 — 但对于敏感工作,这是值得做的权衡。 实际影响:我对任何接触代码、内部流程或客户数据的内容运行本地。我使用云进行研究和创意工作,以及需要最佳输出的任务。混合方法已成为自然。 仍然不好的地方 在消费级硬件上进行微调仍然痛苦。LoRA有效但需要大量实验才能正确。工具改进了但过程仍适合喜欢调试的人。 上下文窗口管理被低估了。运行128K上下文窗口听起来很棒,直到你意识到它消耗多少RAM以及推理变得多慢。实际上,16K-32K是大多数任务的最佳选择。 多模态模型终于变好了但设置开销仍然很高。如果你需要视觉,云仍然更实用,除非你有特定的合规要求。 底线 本地AI不再是科学项目。它是生产基础设施。问题不是是否可能 — 而是维护成本是否值得你的用例的隐私和成本优势。 对我来说是的。我运行本地两年了,没有回头。但我也不会假装它适合每个人。了解你的工作负载,了解你的硬件,根据实际数字做出决定。 本系列的下一篇文章将涵盖RAG实现 — 将你的文档放入模型中,以便本地AI能够真正推理你的特定上下文。

2026年4月10日 · nuteo
AI清洗:每个科技从业者都应识别的企业烟雾弹

AI清洗:每个科技从业者都应识别的企业烟雾弹

2026年第一季度,各公司将 AI 列为裁员的首要原因,连续第二个月 — 不是因为 AI 真正取代了这些工作岗位,而是因为说"我们因 AI 重组"比"我们为取悦投资者而削减成本"听起来更容易辩护

2026年4月10日 · nuteo