現正接案 — 2026 第三季
首頁/觀點/why-not-build-ai-custom-app-yourself
封面文章INSIGHT2026-05-0613 分鐘技術洞察

自己用 AI 做還是找顧問做?企業客製系統的 18 個月成本帳

DIY 路徑前 4 週看起來省 80%,第 18 個月結帳——重做一次的代價,是一開始就找對人的 3 倍

Eric Shen
CEO / Salesforce CTA
分享文章已複製連結!
自己用 AI 做還是找顧問做?企業客製系統的 18 個月成本帳

摘要

  • 核心論點:DIY 用 AI 做企業客製系統,前 4 週看起來省下 80% 的成本,但真正的帳要在第 18 個月結算——而那時候,重做一次比一開始就找對人貴 3 倍。AI 沒有讓開發變便宜,AI 把成本挪到後面,而且加了利息。
  • 同樣的工具,不同的駕駛:專家用 AI 是持續糾偏迴圈,「不對,這個 query 在 10 萬筆會掛」「不對,這個 useEffect 會無限迴圈」;非專家用 AI 是跟團導航,AI 說什麼就照做。最致命的是 AI 寫錯但「看起來對」,這時候只有專家會抓到。
  • AI 還做不好的不是技術,是責任:production SLA、合規稽核、原工程師離職後的交接、客戶升級時的應對——這四件事 AI 全部做不到。買顧問,本質上買的是這四件事,不是程式碼。
  • 不是什麼都該外包,是該外包的請外包:你的工程師應該寫的是只有你們能寫的程式(業務差異化的核心 IP),不該寫通用後台、客戶 Portal、HR 工具——這些有現成最佳實踐的東西。AI 時代最貴的不是工程師,是用錯地方的工程師時間。

一、那個熟悉的週會場景

這個畫面你大概見過:

週會上,IT 主管打開簡報:「這個專案不複雜,內部後台加客戶查詢功能。我們有 Cursor 也有 Claude Code,派兩個資深工程師,內部做就好,省下外包報價的 600 萬。」CEO 點頭,CFO 在筆記本上劃掉一筆預算,會議結束。

決定下了。看起來理性、看起來省錢、看起來內部團隊「最了解我們的業務」。

問題是:這個決定的對錯,要等到 18 個月後才看得出來。而看出來的時候,重新做一次的成本,會比一開始就找對人多出 3 倍。

這篇文章沿著時間軸拆解一遍——第 4 週、第 6 個月、第 12 個月、第 18 個月,DIY 路徑各撞到什麼牆,以及為什麼這條路在 AI 時代反而變得更危險,不是更安全。

二、為什麼這個決定看起來這麼合理

我先誠實承認:DIY 用 AI 做的這條路徑,吸引力是真實的,不是幻覺。

  • AI 工具確實便宜。每位工程師每月 50 到 200 美金的訂閱費,比起外包報價的 600 萬,數字上完全不同量級。
  • 內部團隊有 context。他們知道你們的業務、知道老闆的偏好、知道哪個部門用了哪套舊系統。這個 context 確實是外部顧問要花時間才補得起來的。
  • 沒有採購流程的摩擦。RFP、比價、合約、PO——這些東西真實地在拖慢決策。內部做,下週就能開始 commit code。

這三件事都對。但都只對一半。

它們對的是 day 1 到 day 30 的視角;錯的是 day 31 到 day 540 的視角。下面我們把 540 天拆開來看。

三、第 4 週——看起來省了 80%

四週後,內部團隊端出 demo。登入頁、儀表板、主流程都跑得動,UI 還意外地漂亮——AI 對視覺有意見,沒意見的是業務上下文。

老闆滿意。IT 主管在週會邀功。CFO 開始想,明年的 IT 預算是不是該更多花在自建上。

這時候你需要釘住一個觀念:那不是系統,那是 demo

Demo 是 happy path 跑得通;系統是 18 個月後員工還願意用、稽核還過得了、合規檢查不會爆。Demo 是給高層看的,系統是給每天 200 個使用者用的。Demo 用乾淨的測試資料,系統要面對 5 年累積的歷史髒資料、半年內三次併購進來的新分公司、三個不同會計年度的轉檔。

這兩個東西的距離,看起來是「再做幾個 sprint」,實際上是 12 個月以上的工程紀律——不是 AI 能寫出來的紀律,是經驗才能架出來的紀律。

四、第 6 個月——整合債開始浮現

第二季結束,DIY 路徑撞到的第一面牆,叫做整合債。

AI 寫獨立的小功能很強。但企業系統幾乎沒有「獨立的小功能」這種東西——每個系統都得跟既有的東西串:SSO、ERP、資料倉儲、財會系統、既有的權限體系、既有的客戶主檔。

而 AI 不知道:

  • 你們公司的 SSO 是怎麼設的,OIDC 還是 SAML,scope 切了哪些
  • 你們的 row-level security 規則——A 部門看得到誰、B 部門看不到誰
  • 你們的 ERP 主鍵跟新系統怎麼對映、新增資料時要不要回寫
  • 你們業務邏輯的 edge case:「VIP 客戶例外」「跨年度結轉」「歷史資料怎麼遷」「離職員工的單怎麼處理」

最危險的不是 AI 寫不出來,是 AI 猜了一個合理的版本寫出來。Type 過了、編譯過了、測試也過了——但跑到 production 撞到第一筆 timezone-aware 的真實資料就爆。

內部團隊開始花時間不是在做新功能,是在 debug AI 寫的東西。寫的速度遠不如改的速度。AI 加速器這時候開始反向作用。

五、第 12 個月——維運的真實成本登場

第一年走完。這時候出現的問題不是「寫不寫得出來」,是「能不能撐得住」。

寫的人離職了。原本兩個資深工程師,一個跳槽到新創、一個轉去做 AI 應用,留下一份沒有 ADR、沒有測試、註解寫得像 AI 自言自語的 codebase。新接手的人花兩週讀 code,得到的結論是:「這個東西要不重寫,要不就得花我 3 個月才弄清楚。」

沒有 on-call rota。凌晨兩點 production 噴錯,沒人收到告警;早上九點客服收到 30 通電話,才發現昨晚 11 點起資料就寫不進去了。

合規稽核問題暴露。會計師事務所做年度盤點,發現個資欄位沒加密、log 沒有 retention policy、稽核軌跡缺漏。財務長被叫去解釋——而能解釋的人,已經離職了。

第二個釘住的觀念:AI 把寫程式變便宜了,把「理解程式」變貴了。AI 寫的 code 量是過去的 3 倍,但能讀懂、能 debug、能延伸的人沒有變多。Codebase 的可維運性,是 AI 沒辦法寫進去的東西——那是規範、是 ADR、是 review 文化、是 observability、是 day 1 就該到位的東西,不是 month 12 才補的東西。

六、第 18 個月——結帳

到了第 18 個月,這個系統要不重寫,要不就得編一筆預算來「正式化」它——補測試、補文件、補 observability、補合規、補一個能維護它的團隊。

這時候 CFO 把三條路的帳算出來放在桌上:

階段傳統外包DIY + AI找對的顧問
月 1–3 開發NT$600 萬NT$80 萬NT$360 萬
月 4–12 維運修補NT$100 萬NT$280 萬NT$80 萬
月 13–18 重構或重做0NT$500 萬0
18 個月總計NT$700 萬NT$860 萬NT$440 萬

(以上為匿名化整理過的觀察值,不是單一客戶的真實數字。實際區間因產業跟複雜度而異。)

第三個釘住的觀念:DIY 不是省錢,是把錢挪到後面付,而且加了利息

這張表還沒算進兩件更貴的事:(1) 這 18 個月期間,業務沒拿到的功能、沒做出來的差異化;(2) 一個 18 個月才能上軌道的系統,背後是士氣磨損的內部團隊、失去信心的業務單位、對 IT 不再有期待的高層。

七、那個分水嶺到底是什麼——專家 vs 非專家用 AI

很多人讀到這裡會問:「不對啊,我們內部也是資深工程師,為什麼 DIY 的結果會這麼差?」

答案是:差別不在工具強不強,差別在駕駛的人。

專家用 AI,是糾偏迴圈

  • 「AI 你這個 query 在 10 萬筆資料會慢到不能用,重寫」
  • 「AI 你這個 useEffect 的依賴陣列會造成無限迴圈,改」
  • 「AI 你這個 try-catch 是 silent fail,把 error 拋出來」
  • 「AI 你這個 API 我查不到文件,是不是你腦補的?」

每一輪互動都在校正方向,AI 是被駕馭的工具。

非專家用 AI,是跟團導航

AI 說什麼就照做。AI 說「我不確定但通常會這樣寫」也照做。AI 寫了一個外部 API 呼叫,看起來合理,code review 也是另一個用 AI 的人——大家一起點頭通過。

最致命的失敗模式不是 AI 寫錯,是 AI 寫錯但看起來對——type 通過、編譯過、demo 跑得起來、PR review 也覺得合理,這時候只有真正的專家會抓到「不對,這個寫法在 production 跑大量資料會出事」。

同樣的 AI 工具,不同的駕駛,產出品質差距 5 到 10 倍。這個差距在 day 1 看不出來,在 month 12 看得很清楚。

「我們內部也是資深工程師」——這句話的關鍵是:他們是這個領域、這個技術棧、這個整合問題的資深,還是「在我們公司算資深」?這兩件事在 AI 時代差別變大了,不是變小。

八、AI 還做不好的四件事——責任,不是技術

關於「AI 不擅長什麼」,市面上的清單講的多半是技術判斷:edge case、架構取捨、提問能力。這些都對,但對買方來說,更切身的是另外四件事:

  1. AI 不會替你扛 production 的 SLA。簽約是法人對法人的事,AI 不在合約上。系統凌晨兩點掛掉,要爬起來修的不是 AI。
  2. AI 不會在合規稽核時站出來作證。會計師、稽核、主管機關問「這個資料保留政策誰決定的、為什麼這樣設計」,需要有人能解釋——而且要能在三年後的稽核還在解釋。AI 不上場。
  3. AI 不會在原工程師離職後接手交接。Codebase 沒有 docs 沒有 ADR,AI 重新讀一次只會生出新的解釋,不是真實的歷史脈絡。
  4. AI 不會在客戶升級時拿起電話。B2B 系統撞到客訴,需要有人打電話、開會、解釋、承諾、補救。AI 不打電話。

這四件事都不是「技術能力」維度,是「責任承擔」維度。買顧問,本質上買的是這四件事,不是程式碼——程式碼 AI 也能寫。

九、那是不是什麼都該外包?——機會成本論

不是。這篇文章不是在主張「企業不應該有內部工程師」,恰恰相反。

問題不是「要不要自己做」,問題是「自己做應該做哪些」。

你的內部工程師應該寫的是:只有你們能寫的程式——業務差異化的核心 IP、跟你們獨家資料模型耦合的演算法、決定你們競爭優勢的部分。這些東西沒有顧問幫得了你,因為它們的 know-how 就是你的護城河。

通用的東西——員工後台、客戶 Portal、HR 工具、Finance 工具、整合層、資料同步——這些有現成的最佳實踐、有大量公開的設計模式、有可以直接套用的合規框架。把這些外包出去,把 AI 給做這些做了 50 次的專家用。

AI 時代最貴的不是工程師的薪水,是用錯地方的工程師時間。讓你最強的工程師去寫一個 HR 簽核流程,等於拿你最稀缺的資源去做一件市面上有 100 種範本的事。同樣的時間,他們本來可以在做一個沒有人做過、只有你們能做的東西。

決策的問法應該變一下:不是「這個案子內部能不能做」,是「這個案子值不值得內部做」。

十、那找顧問你買的到底是什麼

說到這裡,買賣的東西就清楚了。

找對的顧問,你買的不是程式碼。程式碼 AI 也能寫,而且寫得很快。你買的是四件事:

  • 判斷力:哪些東西該自己寫、哪些該用框架、哪些可以丟給 AI、哪些絕對不能丟給 AI。這個判斷的成本在 day 1 看不到,在 month 18 看到的是 5 倍的價差。
  • 風險承擔:SLA、合約責任、issue 升級路徑、保險。出事的時候有人扛、合規時有人作證、稽核時有人解釋。這是內部 DIY 沒辦法 transfer 出去的東西。
  • 維運紀律:ADR、自動化測試、observability、code review 文化、CI/CD pipeline——這些東西在 day 1 就該到位,不是 month 18 才補。day 1 補進去成本是 1,month 18 補進去成本是 10。
  • AI 治理:prompt template 怎麼設計、hallucination 怎麼控制、AI 寫的 code 怎麼追蹤、production 出事怎麼歸因。這是 2024 之後才出現的全新工程議題,內部團隊沒做過 50 次的人很難一年內補齊。

這四件事合起來,才是「找對顧問」真正的差異化。如果你想看我們在實作層面怎麼做這四件事,可以讀我們的 VIBE Coding 工作流拆解——那篇是這篇的姊妹篇,講的是當你決定外包之後,我們在每個環節做什麼。

我們的 Vibe Coding 服務頁 列出了典型專案類型跟交付方式,可以對照看你的案子是不是適合。

十一、結論:先把 18 個月的帳算清楚再決定

回到開頭那個週會場景。

如果你正在做這個決策——一個內部系統,要自己做還是找顧問做——這篇文章想留給你的不是答案,是一個更好的問問題的方法:

先把 18 個月的帳算清楚再決定

不是 4 週的 demo 帳,不是 3 個月的開發帳,是 18 個月之後系統還在跑、員工還在用、稽核還過得了的那個帳。把這筆帳算清楚之後,DIY 是不是真的省錢、找顧問是不是真的貴,會看得很不一樣。

AI 沒有讓顧問變便宜,AI 讓「選錯顧問」的代價變高了。因為 AI 在錯的人手上會 5–10 倍地放大錯誤,在對的人手上才會 5–10 倍地放大判斷力。

如果你想讓我們先免費幫你把這筆 18 個月的帳算一次,看看你的案子適合哪一條路徑——歡迎聯絡我們。我們不會勸你一定要外包;如果算出來自己做更划算,我們會說。

分享文章已複製連結!

想跟我們討論你的 具體場景

30 分鐘,由 CTA 親自接。我們會根據你描述的情境,直接回答「值得做」、「現在還不是時候」或「這不是我們的場景」。

我們使用 Cookie

我們使用必要性 Cookie 維持網站運作,並使用選用的分析 Cookie(Google Analytics)了解訪客如何使用本站。詳見 Cookie 政策隱私政策