Tech Stack
Pendekatan berbasis kapabilitas: tiap kebutuhan dipetakan ke kandidat utama + alternatif yang bisa di-swap. Yang baku & stabil ditandai; yang perlu validasi vendor juga ditandai.
Pemetaan kapabilitas → tooling
| Kapabilitas | Kandidat utama | Alternatif | Untuk | Status |
|---|---|---|---|---|
| Reasoning frontier | Claude Opus / Sonnet 4.x | GPT · Gemini (multi-model) | Tugas reasoning kompleks, perencanaan multi-langkah | stabil |
| Reasoning self-host | Hermes (open-weight) | Llama · Qwen | On-prem / data sensitif yang tak boleh keluar | validasi |
| Integrasi tool (standar) | MCP — Model Context Protocol | Konektor native API | Koneksi reusable ke ERP/HRIS/akuntansi/marketplace | stabil |
| Operasi UI tanpa API | Computer-use / browser-agent | Playwright + agent | Marketplace & sistem lawas tanpa API | validasi |
| Orkestrasi durable | LangGraph · Temporal | Restate · n8n (alur sederhana) | Workflow retry & resume, state machine | stabil |
| Approval bus (HITL) | WhatsApp Cloud API · Telegram Bot API | Slack · Teams | Persetujuan 1-klik di chat | stabil |
| Memory / RAG | pgvector (reuse Postgres) | Pinecone · Qdrant | Memori agent & tanya-jawab dokumen | stabil |
| Observability / eval | Langfuse · OpenTelemetry | Evals kustom | Tracing, monitoring kualitas & biaya | stabil |
| Control plane & audit | CMS Astro + Postgres (Neon) | — | Dashboard, konfigurasi, audit log (sudah dimiliki) | stabil |
Apa itu MCP — dan kenapa penting
Model Context Protocol (MCP) adalah standar terbuka untuk menghubungkan model AI ke tool & sumber data (database, API, aplikasi) lewat antarmuka baku. Tanpa MCP, tiap integrasi ditulis custom & rapuh per-aplikasi. Dengan MCP, satu konektor (mis. ke ERP) dipakai ulang oleh banyak agent & banyak use case.
Tanpa MCP
Integrasi custom per app × per agent → kombinatorial, rapuh saat API berubah, mahal dirawat.
Dengan MCP
Satu konektor per sistem, dipakai semua agent. Tambah agent = nol integrasi baru. Maintainable.
Kapan pakai model frontier vs self-host
| Dimensi | Frontier (Claude API) | Open-weight self-host (Hermes/Llama) |
|---|---|---|
| Kualitas reasoning | Tertinggi | Baik untuk tugas terdefinisi |
| Data residency | Cloud (kontraktual) | Di lingkungan sendiri / air-gapped |
| Biaya | Per-token, tanpa infra | Infra GPU sendiri |
| Cocok untuk | Analisis kompleks, planning | PII/rahasia, klasifikasi volume tinggi |
Stack referensi (rangkuman)
Kanal : WhatsApp Cloud API, Telegram Bot API
Orkestrasi : LangGraph / Temporal (durable, HITL gates)
Model : Claude Opus/Sonnet 4.x + Hermes/Llama (self-host)
Integrasi : MCP servers (ERP, HRIS, Akuntansi, Marketplace)
+ computer-use untuk sistem tanpa API
Memori : pgvector (Postgres/Neon) untuk RAG & state
Audit/Eval : Langfuse + OpenTelemetry + evals kustom
Control : CMS Astro + Postgres (dashboard & audit log) Panduan pemilihan model (tepat-guna)
Tidak semua tugas perlu model termahal. Pemilihan model menjaga kualitas dan biaya.
| Model | Cocok untuk | Catatan biaya |
|---|---|---|
| Claude Opus 4.x | Reasoning kompleks, planning multi-langkah, analisis investasi/legal | Termahal — pakai saat memang perlu |
| Claude Sonnet 4.x | Mayoritas alur agentic, draft, ekstraksi, orkestrasi | Keseimbangan kualitas/biaya — default |
| Claude Haiku 4.5 | Klasifikasi, routing, tugas ringan volume tinggi | Termurah — untuk skala |
| Open-weight (Hermes/Llama) | Data sensitif on-prem; klasifikasi terdefinisi | Biaya infra GPU sendiri |
Ekonomi token (kendali biaya)
- Prompt caching — konteks/playbook yang berulang di-cache → biaya & latensi turun drastis.
- Pemilihan model — turunkan ke model lebih murah untuk tugas ringan.
- Batasi konteks — kirim hanya data relevan (RAG terarah), bukan seluruh dokumen.
- Budget & alert per use case/klien; passthrough biaya LLM ke klien bila relevan.
- Batch untuk tugas non-real-time → lebih hemat.
Katalog MCP server (yang umum dibangun)
| MCP server | Menghubungkan ke | Aksi tipikal |
|---|---|---|
| ERP/Akuntansi | SAP, Oracle, Accurate, Xero, dll. | Cek anggaran, buat PO, posting jurnal, tarik laporan |
| HRIS | Talenta/HR system | Data karyawan, cuti, absensi, akun |
| Email & kalender | Google/Microsoft 365 | Kirim/baca email, jadwalkan |
| Messaging | WhatsApp, Telegram, Slack | Kirim approval, notifikasi |
| Database / DWH | Postgres, BigQuery | Query, laporan, RAG |
| Marketplace / web | Situs vendor/e-commerce | Cari produk, bandingkan (computer-use bila tanpa API) |
Build vs Buy
Buy (pakai yang ada)
Model (Claude API), MCP, framework orkestrasi (LangGraph/Temporal), observability (Langfuse), approval bus (WA/Telegram API). Jangan bangun ulang yang sudah matang.
Build (kekayaan Dobeon)
Policy-as-code, pustaka konektor MCP per-sistem klien, playbook per use case, control plane/dashboard, evals domain.
Reuse (sudah ada)
CMS Astro + Postgres (Neon) + auth + audit log → control plane & jejak audit.
Kerangka evaluasi (evals)
- Golden set — kumpulan kasus berlabel benar per use case untuk uji regresi.
- Metrik — akurasi, % perlu koreksi manusia, halusinasi, biaya/latensi.
- Uji berkelanjutan — jalankan evals tiap perubahan prompt/model; cegah regresi & drift.
- Gerbang promote — naik level hanya bila evals + metrik produksi lolos ambang.