Tech Stack · Dobeon Agentic Operations

Pendekatan berbasis kapabilitas: tiap kebutuhan dipetakan ke kandidat utama + alternatif yang bisa di-swap. Yang baku & stabil ditandai; yang perlu validasi vendor juga ditandai.

Jujur soal nama produk: stabil = baku & siap pakai (MCP, Claude, WhatsApp/Telegram). validasi = kategori/produk yang dikonfirmasi saat seleksi vendor (mis. Hermes versi mana, produk computer-use tertentu).

Pemetaan kapabilitas → tooling

Kapabilitas	Kandidat utama	Alternatif	Untuk	Status
Reasoning frontier	Claude Opus / Sonnet 4.x	GPT · Gemini (multi-model)	Tugas reasoning kompleks, perencanaan multi-langkah	stabil
Reasoning self-host	Hermes (open-weight)	Llama · Qwen	On-prem / data sensitif yang tak boleh keluar	validasi
Integrasi tool (standar)	MCP — Model Context Protocol	Konektor native API	Koneksi reusable ke ERP/HRIS/akuntansi/marketplace	stabil
Operasi UI tanpa API	Computer-use / browser-agent	Playwright + agent	Marketplace & sistem lawas tanpa API	validasi
Orkestrasi durable	LangGraph · Temporal	Restate · n8n (alur sederhana)	Workflow retry & resume, state machine	stabil
Approval bus (HITL)	WhatsApp Cloud API · Telegram Bot API	Slack · Teams	Persetujuan 1-klik di chat	stabil
Memory / RAG	pgvector (reuse Postgres)	Pinecone · Qdrant	Memori agent & tanya-jawab dokumen	stabil
Observability / eval	Langfuse · OpenTelemetry	Evals kustom	Tracing, monitoring kualitas & biaya	stabil
Control plane & audit	CMS Astro + Postgres (Neon)	—	Dashboard, konfigurasi, audit log (sudah dimiliki)	stabil

Apa itu MCP — dan kenapa penting

Model Context Protocol (MCP) adalah standar terbuka untuk menghubungkan model AI ke tool & sumber data (database, API, aplikasi) lewat antarmuka baku. Tanpa MCP, tiap integrasi ditulis custom & rapuh per-aplikasi. Dengan MCP, satu konektor (mis. ke ERP) dipakai ulang oleh banyak agent & banyak use case.

Tanpa MCP

Integrasi custom per app × per agent → kombinatorial, rapuh saat API berubah, mahal dirawat.

Dengan MCP

Satu konektor per sistem, dipakai semua agent. Tambah agent = nol integrasi baru. Maintainable.

Kapan pakai model frontier vs self-host

Dimensi	Frontier (Claude API)	Open-weight self-host (Hermes/Llama)
Kualitas reasoning	Tertinggi	Baik untuk tugas terdefinisi
Data residency	Cloud (kontraktual)	Di lingkungan sendiri / air-gapped
Biaya	Per-token, tanpa infra	Infra GPU sendiri
Cocok untuk	Analisis kompleks, planning	PII/rahasia, klasifikasi volume tinggi

Banyak deployment hibrid: frontier untuk reasoning sulit, self-host untuk data sensitif — diabstraksi lewat orchestration layer.

Stack referensi (rangkuman)

Kanal      : WhatsApp Cloud API, Telegram Bot API
Orkestrasi : LangGraph / Temporal (durable, HITL gates)
Model      : Claude Opus/Sonnet 4.x  +  Hermes/Llama (self-host)
Integrasi  : MCP servers (ERP, HRIS, Akuntansi, Marketplace)
            + computer-use untuk sistem tanpa API
Memori     : pgvector (Postgres/Neon) untuk RAG & state
Audit/Eval : Langfuse + OpenTelemetry + evals kustom
Control    : CMS Astro + Postgres (dashboard & audit log)

Panduan pemilihan model (tepat-guna)

Tidak semua tugas perlu model termahal. Pemilihan model menjaga kualitas dan biaya.

Model	Cocok untuk	Catatan biaya
Claude Opus 4.x	Reasoning kompleks, planning multi-langkah, analisis investasi/legal	Termahal — pakai saat memang perlu
Claude Sonnet 4.x	Mayoritas alur agentic, draft, ekstraksi, orkestrasi	Keseimbangan kualitas/biaya — default
Claude Haiku 4.5	Klasifikasi, routing, tugas ringan volume tinggi	Termurah — untuk skala
Open-weight (Hermes/Llama)	Data sensitif on-prem; klasifikasi terdefinisi	Biaya infra GPU sendiri

Pola umum: router murah (Haiku) menentukan rute → Sonnet mengeksekusi mayoritas → Opus hanya untuk langkah tersulit. Tambah prompt caching untuk konteks berulang.

Ekonomi token (kendali biaya)

Prompt caching — konteks/playbook yang berulang di-cache → biaya & latensi turun drastis.
Pemilihan model — turunkan ke model lebih murah untuk tugas ringan.
Batasi konteks — kirim hanya data relevan (RAG terarah), bukan seluruh dokumen.
Budget & alert per use case/klien; passthrough biaya LLM ke klien bila relevan.
Batch untuk tugas non-real-time → lebih hemat.

Katalog MCP server (yang umum dibangun)

MCP server	Menghubungkan ke	Aksi tipikal
ERP/Akuntansi	SAP, Oracle, Accurate, Xero, dll.	Cek anggaran, buat PO, posting jurnal, tarik laporan
HRIS	Talenta/HR system	Data karyawan, cuti, absensi, akun
Email & kalender	Google/Microsoft 365	Kirim/baca email, jadwalkan
Messaging	WhatsApp, Telegram, Slack	Kirim approval, notifikasi
Database / DWH	Postgres, BigQuery	Query, laporan, RAG
Marketplace / web	Situs vendor/e-commerce	Cari produk, bandingkan (computer-use bila tanpa API)

Build vs Buy

Buy (pakai yang ada)

Model (Claude API), MCP, framework orkestrasi (LangGraph/Temporal), observability (Langfuse), approval bus (WA/Telegram API). Jangan bangun ulang yang sudah matang.

Build (kekayaan Dobeon)

Policy-as-code, pustaka konektor MCP per-sistem klien, playbook per use case, control plane/dashboard, evals domain.

Reuse (sudah ada)

CMS Astro + Postgres (Neon) + auth + audit log → control plane & jejak audit.

Kerangka evaluasi (evals)

Golden set — kumpulan kasus berlabel benar per use case untuk uji regresi.
Metrik — akurasi, % perlu koreksi manusia, halusinasi, biaya/latensi.
Uji berkelanjutan — jalankan evals tiap perubahan prompt/model; cegah regresi & drift.
Gerbang promote — naik level hanya bila evals + metrik produksi lolos ambang.

Bagaimana semuanya tersusun → Arsitektur← Kembali Keamanan & kontrol → Tata KelolaLanjut → Apa yang dijalankan → Katalog Use CaseLanjut → Versi presentasi → DeckBuka deck →