
這個畫面你大概見過:
週會上,IT 主管打開簡報:「這個專案不複雜,內部後台加客戶查詢功能。我們有 Cursor 也有 Claude Code,派兩個資深工程師,內部做就好,省下外包報價的 600 萬。」CEO 點頭,CFO 在筆記本上劃掉一筆預算,會議結束。
決定下了。看起來理性、看起來省錢、看起來內部團隊「最了解我們的業務」。
問題是:這個決定的對錯,要等到 18 個月後才看得出來。而看出來的時候,重新做一次的成本,會比一開始就找對人多出 3 倍。
這篇文章沿著時間軸拆解一遍——第 4 週、第 6 個月、第 12 個月、第 18 個月,DIY 路徑各撞到什麼牆,以及為什麼這條路在 AI 時代反而變得更危險,不是更安全。
我先誠實承認:DIY 用 AI 做的這條路徑,吸引力是真實的,不是幻覺。
這三件事都對。但都只對一半。
它們對的是 day 1 到 day 30 的視角;錯的是 day 31 到 day 540 的視角。下面我們把 540 天拆開來看。
四週後,內部團隊端出 demo。登入頁、儀表板、主流程都跑得動,UI 還意外地漂亮——AI 對視覺有意見,沒意見的是業務上下文。
老闆滿意。IT 主管在週會邀功。CFO 開始想,明年的 IT 預算是不是該更多花在自建上。
這時候你需要釘住一個觀念:那不是系統,那是 demo。
Demo 是 happy path 跑得通;系統是 18 個月後員工還願意用、稽核還過得了、合規檢查不會爆。Demo 是給高層看的,系統是給每天 200 個使用者用的。Demo 用乾淨的測試資料,系統要面對 5 年累積的歷史髒資料、半年內三次併購進來的新分公司、三個不同會計年度的轉檔。
這兩個東西的距離,看起來是「再做幾個 sprint」,實際上是 12 個月以上的工程紀律——不是 AI 能寫出來的紀律,是經驗才能架出來的紀律。
第二季結束,DIY 路徑撞到的第一面牆,叫做整合債。
AI 寫獨立的小功能很強。但企業系統幾乎沒有「獨立的小功能」這種東西——每個系統都得跟既有的東西串:SSO、ERP、資料倉儲、財會系統、既有的權限體系、既有的客戶主檔。
而 AI 不知道:
最危險的不是 AI 寫不出來,是 AI 猜了一個合理的版本寫出來。Type 過了、編譯過了、測試也過了——但跑到 production 撞到第一筆 timezone-aware 的真實資料就爆。
內部團隊開始花時間不是在做新功能,是在 debug AI 寫的東西。寫的速度遠不如改的速度。AI 加速器這時候開始反向作用。
第一年走完。這時候出現的問題不是「寫不寫得出來」,是「能不能撐得住」。
寫的人離職了。原本兩個資深工程師,一個跳槽到新創、一個轉去做 AI 應用,留下一份沒有 ADR、沒有測試、註解寫得像 AI 自言自語的 codebase。新接手的人花兩週讀 code,得到的結論是:「這個東西要不重寫,要不就得花我 3 個月才弄清楚。」
沒有 on-call rota。凌晨兩點 production 噴錯,沒人收到告警;早上九點客服收到 30 通電話,才發現昨晚 11 點起資料就寫不進去了。
合規稽核問題暴露。會計師事務所做年度盤點,發現個資欄位沒加密、log 沒有 retention policy、稽核軌跡缺漏。財務長被叫去解釋——而能解釋的人,已經離職了。
第二個釘住的觀念:AI 把寫程式變便宜了,把「理解程式」變貴了。AI 寫的 code 量是過去的 3 倍,但能讀懂、能 debug、能延伸的人沒有變多。Codebase 的可維運性,是 AI 沒辦法寫進去的東西——那是規範、是 ADR、是 review 文化、是 observability、是 day 1 就該到位的東西,不是 month 12 才補的東西。
到了第 18 個月,這個系統要不重寫,要不就得編一筆預算來「正式化」它——補測試、補文件、補 observability、補合規、補一個能維護它的團隊。
這時候 CFO 把三條路的帳算出來放在桌上:
| 階段 | 傳統外包 | DIY + AI | 找對的顧問 |
|---|---|---|---|
| 月 1–3 開發 | NT$600 萬 | NT$80 萬 | NT$360 萬 |
| 月 4–12 維運修補 | NT$100 萬 | NT$280 萬 | NT$80 萬 |
| 月 13–18 重構或重做 | 0 | NT$500 萬 | 0 |
| 18 個月總計 | NT$700 萬 | NT$860 萬 | NT$440 萬 |
(以上為匿名化整理過的觀察值,不是單一客戶的真實數字。實際區間因產業跟複雜度而異。)
第三個釘住的觀念:DIY 不是省錢,是把錢挪到後面付,而且加了利息。
這張表還沒算進兩件更貴的事:(1) 這 18 個月期間,業務沒拿到的功能、沒做出來的差異化;(2) 一個 18 個月才能上軌道的系統,背後是士氣磨損的內部團隊、失去信心的業務單位、對 IT 不再有期待的高層。
很多人讀到這裡會問:「不對啊,我們內部也是資深工程師,為什麼 DIY 的結果會這麼差?」
答案是:差別不在工具強不強,差別在駕駛的人。
專家用 AI,是糾偏迴圈:
每一輪互動都在校正方向,AI 是被駕馭的工具。
非專家用 AI,是跟團導航:
AI 說什麼就照做。AI 說「我不確定但通常會這樣寫」也照做。AI 寫了一個外部 API 呼叫,看起來合理,code review 也是另一個用 AI 的人——大家一起點頭通過。
最致命的失敗模式不是 AI 寫錯,是 AI 寫錯但看起來對——type 通過、編譯過、demo 跑得起來、PR review 也覺得合理,這時候只有真正的專家會抓到「不對,這個寫法在 production 跑大量資料會出事」。
同樣的 AI 工具,不同的駕駛,產出品質差距 5 到 10 倍。這個差距在 day 1 看不出來,在 month 12 看得很清楚。
「我們內部也是資深工程師」——這句話的關鍵是:他們是這個領域、這個技術棧、這個整合問題的資深,還是「在我們公司算資深」?這兩件事在 AI 時代差別變大了,不是變小。
關於「AI 不擅長什麼」,市面上的清單講的多半是技術判斷:edge case、架構取捨、提問能力。這些都對,但對買方來說,更切身的是另外四件事:
這四件事都不是「技術能力」維度,是「責任承擔」維度。買顧問,本質上買的是這四件事,不是程式碼——程式碼 AI 也能寫。
不是。這篇文章不是在主張「企業不應該有內部工程師」,恰恰相反。
問題不是「要不要自己做」,問題是「自己做應該做哪些」。
你的內部工程師應該寫的是:只有你們能寫的程式——業務差異化的核心 IP、跟你們獨家資料模型耦合的演算法、決定你們競爭優勢的部分。這些東西沒有顧問幫得了你,因為它們的 know-how 就是你的護城河。
通用的東西——員工後台、客戶 Portal、HR 工具、Finance 工具、整合層、資料同步——這些有現成的最佳實踐、有大量公開的設計模式、有可以直接套用的合規框架。把這些外包出去,把 AI 給做這些做了 50 次的專家用。
AI 時代最貴的不是工程師的薪水,是用錯地方的工程師時間。讓你最強的工程師去寫一個 HR 簽核流程,等於拿你最稀缺的資源去做一件市面上有 100 種範本的事。同樣的時間,他們本來可以在做一個沒有人做過、只有你們能做的東西。
決策的問法應該變一下:不是「這個案子內部能不能做」,是「這個案子值不值得內部做」。
說到這裡,買賣的東西就清楚了。
找對的顧問,你買的不是程式碼。程式碼 AI 也能寫,而且寫得很快。你買的是四件事:
這四件事合起來,才是「找對顧問」真正的差異化。如果你想看我們在實作層面怎麼做這四件事,可以讀我們的 VIBE Coding 工作流拆解——那篇是這篇的姊妹篇,講的是當你決定外包之後,我們在每個環節做什麼。
我們的 Vibe Coding 服務頁 列出了典型專案類型跟交付方式,可以對照看你的案子是不是適合。
回到開頭那個週會場景。
如果你正在做這個決策——一個內部系統,要自己做還是找顧問做——這篇文章想留給你的不是答案,是一個更好的問問題的方法:
先把 18 個月的帳算清楚再決定。
不是 4 週的 demo 帳,不是 3 個月的開發帳,是 18 個月之後系統還在跑、員工還在用、稽核還過得了的那個帳。把這筆帳算清楚之後,DIY 是不是真的省錢、找顧問是不是真的貴,會看得很不一樣。
AI 沒有讓顧問變便宜,AI 讓「選錯顧問」的代價變高了。因為 AI 在錯的人手上會 5–10 倍地放大錯誤,在對的人手上才會 5–10 倍地放大判斷力。
如果你想讓我們先免費幫你把這筆 18 個月的帳算一次,看看你的案子適合哪一條路徑——歡迎聯絡我們。我們不會勸你一定要外包;如果算出來自己做更划算,我們會說。
我們還沒做 Agentforce 導入,但花了 18 個月持續評估與追蹤。本文整理:西方早期採用者的失敗模式、Salesforce 平台從 Agent Builder 到 Testing Center 的演進、以及給準備在 2026 啟動的台灣企業的判斷框架與程式碼範例。
我們對自己動手——把過去使用的某外部 SaaS 系統,用 VIBE Coding 重寫成我們自己的「易凱金融雲」。傳統估時 4–6 個月,實際 6 週,部分模組更短。本文拆解人與 AI 在每個工程環節的分工,附我們踩過的坑與可帶走的工作流。
我們的金融客戶實戰來自澳洲——CTO 在兩家澳洲一級銀行與一家中型銀行做過 FSC 導入。本文把這些經驗對應到台灣金融業的法規、核心系統、預算結構,給準備啟動的決策者一份不被廠商行銷帶風向的判斷材料。